close Warning: Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.

Version 4 (modified by Víctor de Buen Remiro, 14 years ago) (diff)

--

Package BysInfDiag

Métodos de Montecarlo para la inferencia y la diagnosis sobre cadenas de Markov (MCMC).

Convergencia de cadenas

Los métodos MCMC garantizan la convergencia bajo ciertos supuestos pero no dicen nada de en qué momento se alcanzará la misma. Por este motivo es necesario tener algún método diagnóstico que calcule la longitud inicial de muestras anteriores a la convergencia para eliminarlas de la muestra (burn-in).

Existen dos clases fundamentales de métodos para

  • sequencia única: Se basan únicamente en una cadena por lo que sólo pueden determinar en cierta medida que la cadena converge a algo, pero no es posible asegurar que converge a la distribución a posteriori, especialmente con distribuciones multimodales o variables vectoriales muy correlacionadas. Los más utilizados son los presentes en el paquete CODA del lenguaje R
    • Raftery and Lewis
    • Geweke
    • Heidelberg and Welch
  • sequencia múltiple: Estos métodos utilizan varias cadenas generadas desde puntos dispersos de la región factible para comprobar que realmente todas las cadenas no sólo convergen cada una por separado sino que además lo hacen a una misma distribución. El método más empleado, por el mismo motivo de aparecer en el CODA, es el
    • Gelman and Rubin

El problema de éste último método es que sólo sirve para distribuciones normales, o bien para aquellas que pueden ser transformadas en normales de una forma sencilla, de tipo Box-Cox por ejemplo. Sin embargo, en los problemas de la vida real esta es una hipótesis demasiado restrictiva, pues aparte de que se pueden manejar otras distribuciones como la chi-cuadrado, logísticas, Poisson, etc.; es muy usual que las normales se trunquen por motivos de coherencia. En cualquier caso, aunque fuera posible esa transformación de la distribución a posteriori, puede que no sea en absoluto trivial hallarla, y menos de forma general sin intervención directa del analista de datos.

Para ser completamente general se precisaría un método independiente de la distribución, como podrían ser métodos de cociente de verosimilitudes u otros de tipo no paramétrico:

  • Ozturk and Balakrishnan : Exact two-sample nonparametric test for quantile difference between two populations based on ranked set samples
  • Barton : Comparisson of two samples bay a nonparametric likelihood-ratio test
  • parzen statistical methods mining and nonparametric quantile domain data analysis
  • Kosorok: Two sample quantile test under general conditions
  • Dette-Wagener-Volgushev: Nonparametric comparison of quantile curves: a stochastic process approach
  • Mann-Whitney U-test: Test no paramétrico para la comparación de medianas de muestras de tamaños arbitrarios, sustitutivo del test de la t-student para muestras normales.

Éste último test en principio sólo nos sirve para comparar las medianas pero tiene la ventaja de ser muy rápido y de que ya existe en TOL como la función AlgLib.MannWhitneyUtest. Podría usarse como filtro inicial a cualquier otro test de comparación de muestras, pues si las medianas son significativamente distintas es evidente que las distribuciones no pueden ser las mismas. Pero además de eso puede usar recursivamente sobre el valor absoluto de las muestras menos la mediana común, tantas veces como se quiera. Sólo si la distribución es la misma en ambos casos el test se aceptará hasta el inifinito.