close Warning: Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Version 3 and Version 4 of OfficialTolArchiveNetworkBysDecision


Ignore:
Timestamp:
Aug 12, 2011, 7:20:30 PM (13 years ago)
Author:
Víctor de Buen Remiro
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • OfficialTolArchiveNetworkBysDecision

    v3 v4  
    7575
    7676Este tipo de problemas pueden resolverse mediante técnicas de optimización continua muy eficaces y
    77 robustos, especialmente cuando el dominio es continuo.
     77robustas, especialmente cuando el dominio es continuo.
    7878
    7979=== Decisión con restricciones ===
     
    8787técnicas de optimización aplicables a esta clase de problemas.
    8888
     89==== Combinación de previsiones ====
     90
     91Un caso particular decisión con restricciones, que resulta  muy interesante para los analistas de datos
     92estadísticos es la mal llamada ''combinación de previsiones'', refiriéndose al problema de obtener
     93estadísticos de un conjunto de variables aletarorias que sean congruentes con ciertas restricciones
     94que en realidad deben cumplir dichas variables aleatorias, y por ende cada una de sus realizaciones
     95conjuntas.
     96
     97Si las distribuciones son todas normales y las restricciones son todas lineales, la media cumplirá
     98dichas restricciones, pero en cualquier otro caso esto no ocurrirá así, y no siempre se tiene presente
     99este hecho.
     100
     101Un ejemplo típico de esta situación es la presencia de una variable aleatoria (a la que llamaremos
     102global) que es la suma de las demás y para la que existe un modelo (o cualquier otra no normal) con
     103menos varianza que en el de las partes también log-normales. Si el modelo se estima por simulación y
     104conjuntamente, obligando a que cada muestra cumpla las restricciones, podremos ver cómo las medias de
     105las partes no suman exactamente la media del global. Si cada modelo se estima por su lado ni las
     106realizaciones ni los estadísticos cumplirán las restricciones.
     107
     108Como en muchas ocasiones se confunde el concepto de previsión, que es una variable aleatoria, con
     109alguno de sus estadísticos centrales (media, mediana y moda), que son simples números, los clientes
     110suelen exigen que esos números sean coherentes con ciertas ecuaciones que son incompatibles con
     111seguir siendo dichos estadísticos.
     112
     113El analista debe tomar una decisión que consiste en decirle al cliente que ''la previsión es
     114cierto número'' aún a sabiendas de que la previsión es una variable aleatoria y que lo que le
     115entrega no es una previsión ni un estadístico de la msima, sino una decisión que es posible
     116optimizar.
     117
     118Lo ideal en estos casos sería convencer al cliente para investigar cuál es su función de coste
     119real y calcularla o aproximarla en la medida de lo posible, o bien inferirla directamente si el
     120negocio es suficientemente conocido y transparente.
     121
     122Si el cliente es refractario a estos conceptos y no hay forma de averiguarla sin su colaboración,
     123el analista sería muy libre de buscar su propia función de coste, entendido como el grado de
     124rechazo por parte del cliente de las "previsiones" entregadas, o mejor aún, estableciendo en
     125el contrato de servicio el precio según cada tipo de error. Si se observa que al cliente le gusta
     126que el sesgo sea simétrico pues se pone una función simétrica, etc.; si prefiere equivocarse un
     127poco más al alza que a la baja pues se va probando con distintos coeficientes relativos; etc. En
     128cierta manera esto sería una forma de sonsacarle al cliente la función de coste de una forma
     129inconsciente, pues muchas veces él tiene la intuición de lo que es bueno o malo para su negocio,
     130aunque no sepa o no quiera trasladarlo a una formulación matemática.
     131
     132En ausencia de información, el último recurso es considerar como función de coste la suma de
     133cuadrados de los sesgos, lo cual será más razonable cuanto más se parezcan los residuos a normales
     134estandarizadas e independientes. En el ejemplo explicado anteriormente de las log-normales cuya suma
     135debe dar otra log-normal, habría que transformar las variables mediante el logaritmo y
     136premultiplicarlas por una descomposición simétrica de la matriz de covarianzas, para obtener
     137residuos normales estandarizados e independientes, y sustituir en la ecuación de restricción la
     138variable original por su expresión en términos de ellos.
     139
     140Esta situación es generalizable a cualquier tipo de restricciones de igualdad y/o desigualdad
     141
     142[[LatexEquation( H\left(\mathcal{X}\right) = 0 )]]
     143
     144[[LatexEquation( G\left(\mathcal{X}\right) \leq 0 )]]
     145
     146sobre variables aleatorias transformadas de una multinormal mediante una función [[LatexEquation( T )]]
     147inversible
     148
     149[[LatexEquation( z=T\left(\mathcal{X}\right)\sim N\left(\mu,\Sigma\right) )]]
     150
     151Los residuos normales estandarizados e independientes serían
     152
     153[[LatexEquation( \xi=L^{-1}\cdot\left(z-\mu\right)\sim N\left(0,I\right)\wedge\Sigma=L\cdot L^{T} )]]
     154
     155La decisión óptima en la métrica transformada sería por tanto la solución del programa no lineal
     156
     157[[LatexEquation( \underset{\delta}{min}\left\{ f\left(\delta,\xi\right)=\left(\delta-\xi\right)^{2}\right\} )]]
     158
     159Sujeto a:
     160
     161  [[LatexEquation( H\left(T^{-1}\left(\mu+L\cdot\xi\right)\right)=0 )]]
     162
     163  [[LatexEquation( G\left(T^{-1}\left(\mu+L\cdot\xi\right)\right)\leq0 )]]
     164
     165Para obtener la solución en términos originales bastaría con calcular
     166
     167[[LatexEquation(d=T^{-1}\left(\mu+L\cdot\delta\right) )]]
     168
     169
    89170{{{
    90171#!comment