[[PageOutline]] = Package BysInfDiag = Métodos de Montecarlo para la inferencia y la diagnosis sobre cadenas de Markov (MCMC). == Convergencia de cadenas == Los métodos MCMC garantizan la convergencia bajo ciertos supuestos pero no dicen nada de en qué momento se alcanzará la misma. Por este motivo es necesario tener algún método diagnóstico que calcule la longitud inicial de muestras anteriores a la convergencia para eliminarlas de la muestra (burn-in). Existen dos clases fundamentales de métodos para * ''sequencia única'': Se basan únicamente en una cadena por lo que sólo pueden determinar en cierta medida que la cadena converge a algo, pero no es posible asegurar que converge a la distribución a posteriori, especialmente con distribuciones multimodales o variables vectoriales muy correlacionadas. Los más utilizados son los presentes en el paquete [http://www.stat.auckland.ac.nz/~millar/Bayesian/BUGS/coda.pdf CODA] del lenguaje [http://www.r-project.org/ R] * ''Raftery and Lewis'' * ''Geweke * ''Heidelberg and Welch'' * ''sequencia múltiple'': Estos métodos utilizan varias cadenas generadas desde puntos dispersos de la región factible para comprobar que realmente todas las cadenas no sólo convergen cada una por separado sino que además lo hacen a una misma distribución. El método más empleado, por el mismo motivo de aparecer en el CODA, es el * ''Gelman and Rubin'' El problema de éste último método es que sólo sirve para distribuciones normales, o bien para aquellas que pueden ser transformadas en normales de una forma sencilla, de tipo Box-Cox por ejemplo. Sin embargo, en los problemas de la vida real esta es una hipótesis demasiado restrictiva, pues aparte de que se pueden manejar otras distribuciones como la chi-cuadrado, logísticas, Poisson, etc.; es muy usual que las normales se trunquen por motivos de coherencia. En cualquier caso, aunque fuera posible esa transformación de la distribución a posteriori, puede que no sea en absoluto trivial hallarla, y menos de forma general sin intervención directa del analista de datos. Para ser completamente general se precisaría un método independiente de la distribución, como podrían ser métodos de cociente de verosimilitudes u otros de tipo no paramétrico: * [http://www.alglib.net/hypothesistesting/mannwhitneyu.php Mann-Whitney U-test]: Test no paramétrico para la comparación de medianas de muestras de tamaños arbitrarios, sustitutivo del test de la t-student para muestras normales. * [http://www.google.es/url?sa=t&source=web&cd=2&ved=0CDUQFjAB&url=http%3A%2F%2Fwww.ism.ac.jp%2Feditsec%2Faism%2Fpdf%2F061_1_0235.pdf&ei=tH6NTsqENPPE4gSD3sSGAQ&usg=AFQjCNEHCQEM5Qc8BZSgU2v9Es6Il7YB4w&sig2=WtNhwn3_dy_wTNCcnpn6YQ Ozturk and Balakrishnan] : Exact two-sample nonparametric test for quantile difference between two populations based on ranked set samples * [http://uknowledge.uky.edu/cgi/viewcontent.cgi?article=1097&context=gradschool_diss Barton] : Comparisson of two samples bay a nonparametric likelihood-ratio test * [http://www.stat.tamu.edu/~eparzen/smethmin.pdf parzen] statistical methods mining and nonparametric quantile domain data analysis * [http://www.bios.unc.edu/~kosorok/909.pdf Kosorok]: Two sample quantile test under general conditions * [http://www.ruhr-uni-bochum.de/imperia/md/content/mathematik3/publications/dewagvol7.pdf Dette-Wagener-Volgushev]: Nonparametric comparison of quantile curves: a stochastic process approach