Context Navigation

close Warning: Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Version 7 and Version 8 of OfficialTolArchiveNetworkBysInfDiag

Timestamp:: Oct 24, 2011, 9:45:04 AM (15 years ago)
Author:: Víctor de Buen Remiro
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

OfficialTolArchiveNetworkBysInfDiag

-                      v7
+                      v8
 Hasta ahora los pasos para la simulación con BSR eran
+. Crear la definición del modelo como un {{{Struct @BSR.ModelDef modelDef}}}
+. Parametrizar la configuración como una instancia de {{{BysMcmc::@Config config}}}
+. Crear el gestor del modelo BSR como una instancia de la clase {{{BysMcmc::@Cycler cycler}}}
+. Crear el gestor de la estimación BSR como una instancia de la clase {{{BysMcmc::@Estim estim}}}
+. Generar la cadena MCMC llamando al método {{{estim::Run}}}
+Si queremos generar múltiples cadenas, los 4 primeros pasos siguen siendo los mismos, salvo que en el paso 2 hay que guardar una copia de config para recuperar la configuración tras el proceso de mezcla
+. Generar unos pocos puntos iniciales muy alejados entre sí
+. Resetear el modelo llamando al método {{{cycler::Initialize}}}
+. Generar un paseo aleatorio sobre-disperso en la región factible, es decir, con más probabilidad cerca de la frontera que en el interior.
+. Extraer unos pocos puntos iniciales lo más alejados entre sí que sea posible partiendo del centro de masas.
+. Cambiar los parámetros de configuración de las estimaciones locales para que
+. no haga ''burn-in'' ni ''thinning'' estándar[[BR]]
+. Preparación del modelo
+. Creación de la definición del modelo como un {{{Struct @BSR.ModelDef modelDef}}}
+. Creación de la configuración como una instancia de {{{BysMcmc::@Config config}}}
+. Creación del gestor del modelo BSR como una instancia de la clase {{{BysMcmc::@Cycler cycler}}}
+. Creación del gestor de la estimación BSR como una instancia de la clase {{{BysMcmc::@Estim estim}}}
+. Generación de la cadena MCMC llamando al método {{{estim::Run}}}
+Si queremos generar múltiples cadenas, la preparación del modelo sigue siendo igual, salvo que en el paso 1.2 hay que guardar una copia de config para recuperar la configuración tras el proceso de mezcla.
+. Preparación del modelo ...
+. Generación de unos pocos puntos iniciales muy alejados entre sí
+. Reseteo del modelo llamando al método {{{cycler::Initialize}}}
+. Generación de candidatos a puntos iniciales mediante un paseo aleatorio sobre-disperso en la región factible, es decir, con más probabilidad cerca de la frontera que en el interior.
+. Extracción de {{{K}}} puntos iniciales lo más alejados entre sí que sea posible partiendo del centro de masas.
+. Reconfiguración de las estimaciones locales para que
+. no hagan ''burn-in'' ni ''thinning'' estándar[[BR]]
 {{{
 #!java
 …
 Real config::mcmc.thinning  :=  0;
 }}}
 . no haga la diagnosis ni los informes de resultados usuales[[BR]]
+. no hagan la diagnosis ni los informes de resultados usuales[[BR]]
 {{{
 #!java
 …
 Real config::do.linear.effects  :=  False;
 }}}
+. Para cada punto inicial {{{x0[k]}}} generar de forma independiente una cadena MCMC  de la distribución a posteriori
+. Resetear el modelo llamando al método cycler::Initialize
+. Asignar el punto inicial con la sentencia {{{Real cycler::_.sampler::setStore(x0[k]);}}}
+. Crear el k-esimo gestor de la estimación BSR como una instancia local de la clase BysMcmc::@Estim local_estim
+. Generar la k-esima cadena local MCMC llamando al método {{{local_estim::Run}}}
+. Devolver la cadena llamando a {{{ cycler::loadFullMcmc(?) }}}
+. Para cada punto inicial {{{x0[k], k = 1 ... K}}} se genera de forma independiente una cadena MCMC para la distribución a posteriori
+. Reseteo del modelo llamando al método cycler::Initialize
+. Asignación del punto inicial con la sentencia {{{Real cycler::_.sampler::setStore(x0[k]);}}}
+. Creación del k-esimo gestor de la estimación BSR como una instancia local de la clase BysMcmc::@Estim local_estim
+. Generar la k-esima cadena local MCMC llamando al método {{{local_estim::Run}}}
+. Retorno de la cadena llamando a {{{ cycler::loadFullMcmc(?) }}} para evitar pisarla en el disco.
+. Chequeo de convergencia de las cadenas correspondientes a una misma variable. En principio el método es para comparar dos muestras. En principio, para extenderlo a más de dos muestras, habría que aplicarlo a todos los {{K*(K-1)/2}}} pares posibles pero eso podría suponer demasiado trabajo, por lo podría ejecutarse sobre un conjunto representativo de pares elegidos aleatoriamente, que podrían ser entre {{2*K}}} y {{4*K}}} pares.
+. Burn-in individualizado de cada cadena
+. Mezclado de las partes no quemadas por concatenación simple.
+. Reporte de de resultados sobre la cadena conjunta
 == Generación en paralelo con BSR ==
+En problemas grandes puede ser interesante utilizar una máquina para la generación de cada cadena.
+Como no es necesario un alto nivel de comunicación entre los distintos procesos involucrados no habría ningún problema en que ésta se desarrollara vía ficheros, pues lo único que habría que hacer sería almacenar el objeto {{{cycler}}} serializado en un fichero {{{cycler.oza}}} que pudieran leer todas las máquinas servidoras, las cuales guardarían las cadenas en ficheros {{{mcmc.k.bbm}}}
+Pero no sólo sería posible paralelizar las MCMC de la distribución a posteriori, si fuera necesario, también sería posible hacerlo en estos puntos
+ * En el paso 2.2 de generación de candidatos sobre-dispersos a puntos iniciales que luego habría que mezclar en una sola matriz para la extracción del punto 2.3.
+ * En el paso 5 de chequeo de la convergencia se pueden dividir los pares de cadenas seleccionadas para que el chequeo se hiciera en varias máquinas a la vez. Sólo habría que recolectar los resultados finales en un lugar preestablecido.
+=== Monitorización de convergencia en paralelo ===
+En el caso de generación en paralelo existiría la posibilidad de que el chequeo de la convergencia lo ejecutara un proceso aparte desde el ''master'' que fuera leyendo cada cierto tiempo las cadenas generadas hasta el momento por cada ''slave'' en sus respectivos archivos {{{mcmc.bbm}}}. Una vez leídas se procedería a chequear la convergencia y en caso positivo se ejecutaría un test de tipo Raftery sobre la cadena conjunta ya quemada, para establecer si la longitud total de la muestra es suficientemente significative y, si efectivamente es así, comunciar a los procesos de alguna forma que ya pueden parar de simular. Luego sólo restaría volver a leer las cadenas para incluir las simulaciones realizadas entre tanto para finalizar con los últimos dos puntos de mezclado y reporte.