close
Warning:
Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.
- Timestamp:
-
Jun 2, 2011, 4:25:30 PM (15 years ago)
- Author:
-
Víctor de Buen Remiro
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
|
v5
|
v6
|
|
| 10 | 10 | Lo prmero es determinar, aunque sea de una forma bastante abstracta por ahora, la clase de modelos |
| 11 | 11 | que queremos ser capaces de manejar, y qué es lo que podremos hacer con ellos una vez construidos. |
| | 12 | |
| | 13 | Una vez delimitados estos objetivos habrá que ver qué parte de ellos puede ser acometida como una |
| | 14 | extensión de la tecnología existente sin romper la compatibilidad hacia atrás y cuáles deben ser |
| | 15 | postergados a un nuevo sistema que incluiría todo lo anterior mediante algún mecanismo de conversión. |
| 12 | 16 | |
| 13 | 17 | === La clase de modelos === |
| … |
… |
|
| 31 | 35 | * Distribución de los residuos |
| 32 | 36 | * caso normal |
| 33 | | * caso generalizado ([http://en.wikipedia.org/wiki/Generalized_linear_model#Probability_distribution overdispersed exponential family]) |
| | 37 | * caso generalizado ([http://en.wikipedia.org/wiki/Generalized_linear_model#Probability_distribution overdispersed exponential family]). Enumero los casos que han sido solicitados alguna vez |
| 34 | 38 | * regresión cualitativa |
| 35 | 39 | * regresión booleana |
| … |
… |
|
| 43 | 47 | * regresión geométrica |
| 44 | 48 | * etc. |
| | 49 | * distribuciones arbitrarias: |
| 45 | 50 | * Matriz de Varianzas-Covarianzas del ruido |
| 46 | 51 | * Diagonal: Regresión ponderada o heterocedástica |
| … |
… |
|
| 87 | 92 | basado únicamente en el logaritmo, salvo una constante, de la función de densidad condicionada |
| 88 | 93 | por el resto de bloques. |
| 89 | | * Estimación parcial: |
| 90 | | * Fijación de parámetros |
| 91 | | * Recarga de estimaciones anteriores |
| 92 | | * Implementación de las restricciones de igualdad |
| 93 | | * Máximo probable: Maximizar la verosimilitud conjunta condicionada por la información a priori y |
| 94 | | las restricciones de igualdad y desigualdad lineales y no lineales. |
| | 94 | * Continuación (resume) de una cadena en una nueva sesión: Esta es una característica tan importante como |
| | 95 | poco usada de BSR que debe ser dada a conocer, pues es de gran utilidad para restablecerse de una |
| | 96 | caída del sistema, o bien si se observa que hay pocoa muestra o no ha convergido todavía, sin tener |
| | 97 | que volver a empezar desde cero. |
| | 98 | * Estimación parcial: |
| | 99 | * Fijación de parámetros |
| | 100 | * Recarga de estimaciones anteriores |
| | 101 | * Implementación de las restricciones de igualdad |
| | 102 | * Estimación máximo probable (MLE): Maximizar la verosimilitud conjunta condicionada por la información |
| | 103 | a priori y las restricciones de igualdad y desigualdad lineales y no lineales. Hasta ahora sólo se ha |
| | 104 | intentado usar en modelos mono-bloque y en el bloque lineal de BSR pero habría que estudiar si el |
| | 105 | esquema de Gibbs en simulación es exportable a la optimización, pues en realidad se trata de |
| | 106 | algoritmos que tienen mucho en común. Podría verse como un método de optmización iterativa en el que |
| | 107 | en cada paso se encuentra el óptimo de un bloque condicionado al resto, hasta que se alcanza un punto |
| | 108 | estacionario o se supera algún otro criterio de parada. La búsqueda de un punto óptimo puede ser útil |
| | 109 | de dos formas distintas: |
| | 110 | * Como paso previo a la simulación MCMC desde un punto inicial que acelere la convergencia, lo cual |
| | 111 | puede ahorrar muchos recursos en modelos grandes y complejos. |
| 95 | 112 | * Como objetivo en sí mismo en los casos en los que tenga sentido, es decir, cuando la distribución |
| 96 | 113 | asintótica se sabe que es por construcción similar a la distribución a posteriori, pero resulte |
| 97 | | notablemente más rápida. |
| 98 | | * Como paso previo a la simulación desde un punto inicial que acelere la convergencia |
| 99 | | * Como distribución asintótica para generar muestras independientes de forma que la salida sea |
| 100 | | análoga a la de la simulación MCMC para poder ser utilizada por los métodos de diagnosis e |
| 101 | | inferencia baysianas. |
| | 114 | notablemente más rápida. En este caso es posible generar muestras independientes de esa distribución |
| | 115 | asintótica de forma que la salida sea análoga a la de la simulación MCMC para poder ser utilizada |
| | 116 | por los métodos de diagnosis e inferencia baysianas. |
| 102 | 117 | * Diagnosis: |
| 103 | 118 | * Chequeo de convergencia |
| … |
… |
|
| 114 | 129 | * Decisión bayesiana |
| 115 | 130 | |
| | 131 | == Plan a corto-medio plazo == |
| | 132 | |
| | 133 | Prácticamente todos los objetivos planteados son extensibles al BSR actual a excepción de la |
| | 134 | distribución de los residuos que debe seguir siendo normal, pues el diseño está basado en esa |
| | 135 | hipótesis y no es planteable la generalización. |
| | 136 | |
| | 137 | El núcleo de BSR puede ser extendido pero lo que parece más complicado es extender la API de |
| | 138 | definición basada en el parser. Habría que establecer un sistema de comunicación directa entre MMS |
| | 139 | y BSR que ataque directamente la estructura de datos manejada. |
| | 140 | |
| | 141 | Esta estructura Bsrde hecho debería ser replanteada como una clase para poder crecer y extenderse |
| | 142 | de una forma más facil de mantener. Para asegurar la compatibilidad con el estado actual bastaría |
| | 143 | con tener un método que cree la instancia a parit |
| | 144 | |
| | 145 | == Plan a medio-largo plazo == |
| | 146 | |
| | 147 | A largo plazo sin embargo está claro que hay que afrontar otras distribuciones distintas de la normal |
| | 148 | y no parece razonable reescribir toda la parafernalia de características adicionales sobre cada |
| | 149 | clase de modelos. Ahora mismo tenemos la base para estimar modelos generalizados pero de un solo bloque, |
| | 150 | es decir, que no se puede introducir jerarquías ni integrar con estructuras ARIMA u omitidos. Tan sólo |
| | 151 | ademiten información a priori escalar, ponderación de datos y restricciones de desigualdad lineal. |
| | 152 | |
| | 153 | |