[[PageOutline]]

= Package BysInfDiag =

Métodos de Montecarlo para la inferencia y la diagnosis sobre cadenas de Markov (MCMC).

== Convergencia de cadenas ==

Los métodos MCMC garantizan la convergencia bajo ciertos supuestos pero no dicen nada 
de en qué momento se alcanzará la misma. Por este motivo es necesario tener algún 
método diagnóstico que calcule la longitud inicial de muestras anteriores a la 
convergencia para eliminarlas de la muestra (burn-in).

Existen dos clases fundamentales de métodos para 

 * ''sequencia única'': Se basan únicamente en una cadena por lo que 
   sólo pueden determinar en cierta medida que la cadena converge a algo, pero no es 
   posible asegurar que converge a la distribución a posteriori, especialmente con 
   distribuciones multimodales o variables vectoriales muy correlacionadas. Los más 
   utilizados son los presentes en el paquete [http://www.stat.auckland.ac.nz/~millar/Bayesian/BUGS/coda.pdf CODA]
   del lenguaje [http://www.r-project.org/ R]
  * ''Raftery and Lewis''
  * ''Geweke
  * ''Heidelberg and Welch''
 * ''sequencia múltiple'': Estos métodos utilizan varias cadenas 
   generadas desde puntos dispersos de la región factible para comprobar que realmente
   todas las cadenas no sólo convergen cada una por separado sino que además lo 
   hacen a una misma distribución. El método más empleado, por el mismo motivo de 
   aparecer en el CODA, es el 
  * ''Gelman and Rubin''

El problema de éste último método es que sólo sirve para distribuciones normales, o bien para 
aquellas que pueden ser transformadas en normales de una forma sencilla, de tipo Box-Cox 
por ejemplo. Sin embargo, en los problemas de la vida real esta es una hipótesis demasiado
restrictiva, pues aparte de que se pueden manejar otras distribuciones como la chi-cuadrado,
logísticas, Poisson, etc.; es muy usual que las normales se trunquen por motivos de 
coherencia. En cualquier caso, aunque fuera posible esa transformación de la distribución 
a posteriori, puede que no sea en absoluto trivial hallarla, y menos de forma general sin 
intervención directa del analista de datos.

Para ser completamente general se precisaría un método independiente de la distribución, 
como podrían ser métodos de cociente de verosimilitudes u otros de tipo no paramétrico:

 * [http://www.alglib.net/hypothesistesting/mannwhitneyu.php Mann-Whitney U-test]: Test no paramétrico para la comparación de medianas de muestras de tamaños arbitrarios, sustitutivo del test de la t-student para muestras normales.
 * [http://www.google.es/url?sa=t&source=web&cd=2&ved=0CDUQFjAB&url=http%3A%2F%2Fwww.ism.ac.jp%2Feditsec%2Faism%2Fpdf%2F061_1_0235.pdf&ei=tH6NTsqENPPE4gSD3sSGAQ&usg=AFQjCNEHCQEM5Qc8BZSgU2v9Es6Il7YB4w&sig2=WtNhwn3_dy_wTNCcnpn6YQ Ozturk and Balakrishnan] : Exact two-sample nonparametric test for quantile difference between two populations based on ranked set samples
 * [http://uknowledge.uky.edu/cgi/viewcontent.cgi?article=1097&context=gradschool_diss Barton] : Comparisson of two samples bay a nonparametric likelihood-ratio test
 * [http://www.stat.tamu.edu/~eparzen/smethmin.pdf parzen] statistical methods mining and nonparametric quantile domain data analysis
 * [http://www.bios.unc.edu/~kosorok/909.pdf Kosorok]: Two sample quantile test under general conditions
 * [http://www.ruhr-uni-bochum.de/imperia/md/content/mathematik3/publications/dewagvol7.pdf Dette-Wagener-Volgushev]: Nonparametric comparison of quantile curves: a stochastic process approach