close
Warning:
Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.
- Timestamp:
-
Jun 2, 2011, 4:25:30 PM (14 years ago)
- Author:
-
Víctor de Buen Remiro
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
v5
|
v6
|
|
10 | 10 | Lo prmero es determinar, aunque sea de una forma bastante abstracta por ahora, la clase de modelos |
11 | 11 | que queremos ser capaces de manejar, y qué es lo que podremos hacer con ellos una vez construidos. |
| 12 | |
| 13 | Una vez delimitados estos objetivos habrá que ver qué parte de ellos puede ser acometida como una |
| 14 | extensión de la tecnología existente sin romper la compatibilidad hacia atrás y cuáles deben ser |
| 15 | postergados a un nuevo sistema que incluiría todo lo anterior mediante algún mecanismo de conversión. |
12 | 16 | |
13 | 17 | === La clase de modelos === |
… |
… |
|
31 | 35 | * Distribución de los residuos |
32 | 36 | * caso normal |
33 | | * caso generalizado ([http://en.wikipedia.org/wiki/Generalized_linear_model#Probability_distribution overdispersed exponential family]) |
| 37 | * caso generalizado ([http://en.wikipedia.org/wiki/Generalized_linear_model#Probability_distribution overdispersed exponential family]). Enumero los casos que han sido solicitados alguna vez |
34 | 38 | * regresión cualitativa |
35 | 39 | * regresión booleana |
… |
… |
|
43 | 47 | * regresión geométrica |
44 | 48 | * etc. |
| 49 | * distribuciones arbitrarias: |
45 | 50 | * Matriz de Varianzas-Covarianzas del ruido |
46 | 51 | * Diagonal: Regresión ponderada o heterocedástica |
… |
… |
|
87 | 92 | basado únicamente en el logaritmo, salvo una constante, de la función de densidad condicionada |
88 | 93 | por el resto de bloques. |
89 | | * Estimación parcial: |
90 | | * Fijación de parámetros |
91 | | * Recarga de estimaciones anteriores |
92 | | * Implementación de las restricciones de igualdad |
93 | | * Máximo probable: Maximizar la verosimilitud conjunta condicionada por la información a priori y |
94 | | las restricciones de igualdad y desigualdad lineales y no lineales. |
| 94 | * Continuación (resume) de una cadena en una nueva sesión: Esta es una característica tan importante como |
| 95 | poco usada de BSR que debe ser dada a conocer, pues es de gran utilidad para restablecerse de una |
| 96 | caída del sistema, o bien si se observa que hay pocoa muestra o no ha convergido todavía, sin tener |
| 97 | que volver a empezar desde cero. |
| 98 | * Estimación parcial: |
| 99 | * Fijación de parámetros |
| 100 | * Recarga de estimaciones anteriores |
| 101 | * Implementación de las restricciones de igualdad |
| 102 | * Estimación máximo probable (MLE): Maximizar la verosimilitud conjunta condicionada por la información |
| 103 | a priori y las restricciones de igualdad y desigualdad lineales y no lineales. Hasta ahora sólo se ha |
| 104 | intentado usar en modelos mono-bloque y en el bloque lineal de BSR pero habría que estudiar si el |
| 105 | esquema de Gibbs en simulación es exportable a la optimización, pues en realidad se trata de |
| 106 | algoritmos que tienen mucho en común. Podría verse como un método de optmización iterativa en el que |
| 107 | en cada paso se encuentra el óptimo de un bloque condicionado al resto, hasta que se alcanza un punto |
| 108 | estacionario o se supera algún otro criterio de parada. La búsqueda de un punto óptimo puede ser útil |
| 109 | de dos formas distintas: |
| 110 | * Como paso previo a la simulación MCMC desde un punto inicial que acelere la convergencia, lo cual |
| 111 | puede ahorrar muchos recursos en modelos grandes y complejos. |
95 | 112 | * Como objetivo en sí mismo en los casos en los que tenga sentido, es decir, cuando la distribución |
96 | 113 | asintótica se sabe que es por construcción similar a la distribución a posteriori, pero resulte |
97 | | notablemente más rápida. |
98 | | * Como paso previo a la simulación desde un punto inicial que acelere la convergencia |
99 | | * Como distribución asintótica para generar muestras independientes de forma que la salida sea |
100 | | análoga a la de la simulación MCMC para poder ser utilizada por los métodos de diagnosis e |
101 | | inferencia baysianas. |
| 114 | notablemente más rápida. En este caso es posible generar muestras independientes de esa distribución |
| 115 | asintótica de forma que la salida sea análoga a la de la simulación MCMC para poder ser utilizada |
| 116 | por los métodos de diagnosis e inferencia baysianas. |
102 | 117 | * Diagnosis: |
103 | 118 | * Chequeo de convergencia |
… |
… |
|
114 | 129 | * Decisión bayesiana |
115 | 130 | |
| 131 | == Plan a corto-medio plazo == |
| 132 | |
| 133 | Prácticamente todos los objetivos planteados son extensibles al BSR actual a excepción de la |
| 134 | distribución de los residuos que debe seguir siendo normal, pues el diseño está basado en esa |
| 135 | hipótesis y no es planteable la generalización. |
| 136 | |
| 137 | El núcleo de BSR puede ser extendido pero lo que parece más complicado es extender la API de |
| 138 | definición basada en el parser. Habría que establecer un sistema de comunicación directa entre MMS |
| 139 | y BSR que ataque directamente la estructura de datos manejada. |
| 140 | |
| 141 | Esta estructura Bsrde hecho debería ser replanteada como una clase para poder crecer y extenderse |
| 142 | de una forma más facil de mantener. Para asegurar la compatibilidad con el estado actual bastaría |
| 143 | con tener un método que cree la instancia a parit |
| 144 | |
| 145 | == Plan a medio-largo plazo == |
| 146 | |
| 147 | A largo plazo sin embargo está claro que hay que afrontar otras distribuciones distintas de la normal |
| 148 | y no parece razonable reescribir toda la parafernalia de características adicionales sobre cada |
| 149 | clase de modelos. Ahora mismo tenemos la base para estimar modelos generalizados pero de un solo bloque, |
| 150 | es decir, que no se puede introducir jerarquías ni integrar con estructuras ARIMA u omitidos. Tan sólo |
| 151 | ademiten información a priori escalar, ponderación de datos y restricciones de desigualdad lineal. |
| 152 | |
| 153 | |