| 89 | ==== Combinación de previsiones ==== |
| 90 | |
| 91 | Un caso particular decisión con restricciones, que resulta muy interesante para los analistas de datos |
| 92 | estadísticos es la mal llamada ''combinación de previsiones'', refiriéndose al problema de obtener |
| 93 | estadísticos de un conjunto de variables aletarorias que sean congruentes con ciertas restricciones |
| 94 | que en realidad deben cumplir dichas variables aleatorias, y por ende cada una de sus realizaciones |
| 95 | conjuntas. |
| 96 | |
| 97 | Si las distribuciones son todas normales y las restricciones son todas lineales, la media cumplirá |
| 98 | dichas restricciones, pero en cualquier otro caso esto no ocurrirá así, y no siempre se tiene presente |
| 99 | este hecho. |
| 100 | |
| 101 | Un ejemplo típico de esta situación es la presencia de una variable aleatoria (a la que llamaremos |
| 102 | global) que es la suma de las demás y para la que existe un modelo (o cualquier otra no normal) con |
| 103 | menos varianza que en el de las partes también log-normales. Si el modelo se estima por simulación y |
| 104 | conjuntamente, obligando a que cada muestra cumpla las restricciones, podremos ver cómo las medias de |
| 105 | las partes no suman exactamente la media del global. Si cada modelo se estima por su lado ni las |
| 106 | realizaciones ni los estadísticos cumplirán las restricciones. |
| 107 | |
| 108 | Como en muchas ocasiones se confunde el concepto de previsión, que es una variable aleatoria, con |
| 109 | alguno de sus estadísticos centrales (media, mediana y moda), que son simples números, los clientes |
| 110 | suelen exigen que esos números sean coherentes con ciertas ecuaciones que son incompatibles con |
| 111 | seguir siendo dichos estadísticos. |
| 112 | |
| 113 | El analista debe tomar una decisión que consiste en decirle al cliente que ''la previsión es |
| 114 | cierto número'' aún a sabiendas de que la previsión es una variable aleatoria y que lo que le |
| 115 | entrega no es una previsión ni un estadístico de la msima, sino una decisión que es posible |
| 116 | optimizar. |
| 117 | |
| 118 | Lo ideal en estos casos sería convencer al cliente para investigar cuál es su función de coste |
| 119 | real y calcularla o aproximarla en la medida de lo posible, o bien inferirla directamente si el |
| 120 | negocio es suficientemente conocido y transparente. |
| 121 | |
| 122 | Si el cliente es refractario a estos conceptos y no hay forma de averiguarla sin su colaboración, |
| 123 | el analista sería muy libre de buscar su propia función de coste, entendido como el grado de |
| 124 | rechazo por parte del cliente de las "previsiones" entregadas, o mejor aún, estableciendo en |
| 125 | el contrato de servicio el precio según cada tipo de error. Si se observa que al cliente le gusta |
| 126 | que el sesgo sea simétrico pues se pone una función simétrica, etc.; si prefiere equivocarse un |
| 127 | poco más al alza que a la baja pues se va probando con distintos coeficientes relativos; etc. En |
| 128 | cierta manera esto sería una forma de sonsacarle al cliente la función de coste de una forma |
| 129 | inconsciente, pues muchas veces él tiene la intuición de lo que es bueno o malo para su negocio, |
| 130 | aunque no sepa o no quiera trasladarlo a una formulación matemática. |
| 131 | |
| 132 | En ausencia de información, el último recurso es considerar como función de coste la suma de |
| 133 | cuadrados de los sesgos, lo cual será más razonable cuanto más se parezcan los residuos a normales |
| 134 | estandarizadas e independientes. En el ejemplo explicado anteriormente de las log-normales cuya suma |
| 135 | debe dar otra log-normal, habría que transformar las variables mediante el logaritmo y |
| 136 | premultiplicarlas por una descomposición simétrica de la matriz de covarianzas, para obtener |
| 137 | residuos normales estandarizados e independientes, y sustituir en la ecuación de restricción la |
| 138 | variable original por su expresión en términos de ellos. |
| 139 | |
| 140 | Esta situación es generalizable a cualquier tipo de restricciones de igualdad y/o desigualdad |
| 141 | |
| 142 | [[LatexEquation( H\left(\mathcal{X}\right) = 0 )]] |
| 143 | |
| 144 | [[LatexEquation( G\left(\mathcal{X}\right) \leq 0 )]] |
| 145 | |
| 146 | sobre variables aleatorias transformadas de una multinormal mediante una función [[LatexEquation( T )]] |
| 147 | inversible |
| 148 | |
| 149 | [[LatexEquation( z=T\left(\mathcal{X}\right)\sim N\left(\mu,\Sigma\right) )]] |
| 150 | |
| 151 | Los residuos normales estandarizados e independientes serían |
| 152 | |
| 153 | [[LatexEquation( \xi=L^{-1}\cdot\left(z-\mu\right)\sim N\left(0,I\right)\wedge\Sigma=L\cdot L^{T} )]] |
| 154 | |
| 155 | La decisión óptima en la métrica transformada sería por tanto la solución del programa no lineal |
| 156 | |
| 157 | [[LatexEquation( \underset{\delta}{min}\left\{ f\left(\delta,\xi\right)=\left(\delta-\xi\right)^{2}\right\} )]] |
| 158 | |
| 159 | Sujeto a: |
| 160 | |
| 161 | [[LatexEquation( H\left(T^{-1}\left(\mu+L\cdot\xi\right)\right)=0 )]] |
| 162 | |
| 163 | [[LatexEquation( G\left(T^{-1}\left(\mu+L\cdot\xi\right)\right)\leq0 )]] |
| 164 | |
| 165 | Para obtener la solución en términos originales bastaría con calcular |
| 166 | |
| 167 | [[LatexEquation(d=T^{-1}\left(\mu+L\cdot\delta\right) )]] |
| 168 | |
| 169 | |