close
Warning:
Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.
- Timestamp:
-
Jan 4, 2011, 2:32:15 PM (14 years ago)
- Author:
-
Víctor de Buen Remiro
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
v2
|
v3
|
|
26 | 26 | [[LatexEquation( r_{i,k}=\sqrt{\underset{d=1}{\overset{n}{\sum}}\left(y_{i,k,d}-x_{i,d}\right)^{2}} )]] [[BR]][[BR]] |
27 | 27 | |
28 | | == Aproximación de la distribución del cardinal de cada entorno local == |
29 | | |
| 28 | == Distribución del cardinal de cada entorno local == |
| 29 | |
30 | 30 | Así las cosas tenemos que el cardinal de cada entorno local, es decir, el número total de puntos muestrales en la hiperesfera de radio [[LatexEquation( r_{i,k} )]] y centro [[LatexEquation( x_{i} )]] es [[BR]][[BR]] |
31 | 31 | [[LatexEquation( h_{i} = k+s_i)]] [[BR]][[BR]] |
32 | 32 | cantidad que se distribuye como una binomial [[BR]][[BR]] |
33 | 33 | [[LatexEquation( \eta_{i} = B\left(S, p_i\rigtht))]] |
34 | | donde [[LatexEquation( p_i )]] es la probabilidad de la hiperesfera, es decir, la integral de la función de densidad en esa hiperesfera [[BR]][[BR]] |
| 34 | donde [[LatexEquation( p_i )]] es la probabilidad de la hiperesfera, es decir, la integral de la función de densidad en cada entorno local [[BR]][[BR]] |
35 | 35 | [[LatexEquation( p_{i}=\int_{\left\Vert y-x_{i}\right\Vert ^{2}\leq r_{i,k}}\pi\left(y\right)\mathrm{d}y )]] [[BR]] |
36 | | Esa integral sería algo muy costoso de evaluar, pero lo que sí conocemos sin coste adicional es el logaritmo de esa densidad, salvo una constante [[LatexEquation(\lambda_0)]] desconocida, evaluado en cada uno de los puntos muestrales, es decir, conocemos |
| 36 | |
| 37 | == Aproximación de la probabilidad del entorno local == |
| 38 | |
| 39 | La anterior integral sería algo muy costoso de evaluar, pero lo que sí conocemos sin coste adicional es el logaritmo de la verosimilitud, salvo una constante [[LatexEquation(\lambda_0)]] desconocida, evaluado en cada uno de los puntos muestrales, es decir, conocemos |
37 | 40 | [[LatexEquation( \ln\pi_{i}=\ln\pi\left(x_{i}\right)+\lambda_0 )]] [[BR]][[BR]] |
38 | 41 | [[LatexEquation( \ln\pi_{i,j}=\ln\pi\left(y_{i,j}\right)+\lambda_0 )]] [[BR]] |
39 | 42 | |
40 | | Podemos pues aproximar dicha integral como el producto de la media de las verosimilitudes por el hipervolumen de la región hiperesférica, que será proporcional a |
| 43 | Podemos pues aproximar dicha integral por el método de Montecarlo, como el producto de la media de las verosimilitudes por el hipervolumen de la región hiperesférica, que será proporcional a |
41 | 44 | [[LatexEquation( r^n_{i,k} )]] [[BR]] |
42 | | obteniendo la relación |
43 | | [[LatexEquation( \ln p_{i}\approx\ln\left(\tilde{p}_{i}\left(\lambda_{1}\right)\right)\approx\lambda_{1}+\ln\left(\pi_{i}+\underset{j=1}{\overset{k}{\prod}}\pi_{i,j}\right)+n\ln r_{i,k} )]] [[BR]] |
44 | | en la que [[LatexEquation(\lambda_1)]] es una constante desconocida. Puesto que la probabilidad no puede ser mayor que 1 tenemos una cota de ella: [[BR]] [[BR]] |
45 | | [[LatexEquation( \lambda_{1}\leq\lambda_{2}=-\underset{i=S'}{\max}\left\{ \ln\left(\pi_{i}+\underset{j=1}{\overset{k}{\prod}}\pi_{i,j}\right)+n\ln r_{i,k}\right\} )]] [[BR]] |
46 | 45 | |
47 | | También es posible mejorar la aproximación de la integral por interpolación, concretamente mediante el [http://www.alglib.net/interpolation/inversedistanceweighting.php método de Sheppard de ponderación inversa a la distancia] que es muy eficiente pues no requiere de ninguna evaluación extra. Esto es especialemente recomendable si existen grandes diferencias en las verosimilitudes de los distintos puntos del vecindario. La interpolación será mejor realizarla en términos logarítmicos pues eso suavizará la función. |
| 46 | Es posible mejorar la aproximación de la integral por interpolación, concretamente mediante el [http://www.alglib.net/interpolation/inversedistanceweighting.php método de Sheppard de ponderación inversa a la distancia] que es muy eficiente pues no requiere de ninguna evaluación extra. Esto es especialemente recomendable si existen grandes diferencias en las verosimilitudes de los distintos puntos del vecindario. La interpolación será mejor realizarla en términos logarítmicos pues eso suavizará la función. |
48 | 47 | |
| 48 | Para ello generaremos [[LatexEquation( N )]] puntos con distribución uniforme en la hiperesfera |
| 49 | [[LatexEquation( \left\Vert z_{i,j}-x_{i}\right\Vert ^{2}\leq r_{i,k} \wedge j=1 \dots N )]] |
| 50 | |
| 51 | y calculamos la aproximación del logaritmo de la verosimilitud en cada uno de ellos mediante la fórmula de ponderación de Sheppard |
| 52 | |
| 53 | [[LatexEquation( \ln\tilde{\pi}\left(z\right)=\frac{\underset{j=0}{\overset{k}{\sum}}w_{j}\left(z\right)\ln\pi_{i,j}}{\underset{j=0}{\overset{k}{\sum}}w_{j}\left(z\right)}\wedge y_{i,0}=x_{i}\wedge\pi_{i,0}=\pi_{i}\wedge w_{j}\left(z\right)=\left\Vert z-y_{i,j}\right\Vert ^{-2} )]] |
| 54 | |
| 55 | De esta forma tenemos la fórmula de aproximación |
| 56 | |
| 57 | [[LatexEquation( \ln p_{i}=\lambda_{1}+\ln\left(\frac{1}{N}\underset{j=1}{\overset{N}{\sum}}\tilde{\pi}_{i}\left(z_{i,j}\right)\right)+n\ln r_{i,k}+\xi_{i} )]] |
| 58 | |
| 59 | en la que el error se postulará por comodidad normal, homocedástico e independiente |
| 60 | |
| 61 | [[LatexEquation( \xi_{i}\sim N\left(0,\sigma\right) )]] |
| 62 | |
| 63 | aunque cabría pensar que en los entornos de relieve más complicado el error puede ser mayor que en las zonas más suaves. |
| 64 | |
| 65 | |
49 | 66 | == Verosimilitud de la constante == |
50 | 67 | |
… |
… |
|
53 | 70 | y el logaritmo de dicha probabilidad del contraste será |
54 | 71 | [[LatexEquation( \ln\left(P_{i}\right)=\ln\left(\begin{array}{c}S\\h_{i}\end{array}\right)+h_{i}\ln p_{i}+\left(S-h_{i}\right)\ln\left(1-p_{i}\right) )]] [[BR]] |
55 | | expresión en la cual se puede aproximar como. |
56 | | [[LatexEquation( \ln\left(P_{i}\right)\approx\ln\left(\tilde{P}_{i}\left(\lambda_{1}\right)\right)\approx\ln\left(\begin{array}{c}S\\h_{i}\end{array}\right)+h_{i}\ln\tilde{p}_{i}\left(\lambda_{1}\right)-\left(S-h_{i}\right)\tilde{p}_{i}\left(\lambda_{1}\right) )]] [[BR]] |
| 72 | |
| 73 | Buscaremos los valores de [[LatexEquation(\lambda_1)]] y [[LatexEquation(\sigma)]] que maximizan la verosimilitud |
| 74 | [[LatexEquation( \underset{\lambda_{1},\sigma}{\max}\left\{ \underset{i=1}{\overset{S'}{\sum}}s_{i}\ln\left(P_{i}\left(\lambda_{1}\right)\right)\right\} )]] [[BR]] |
| 75 | |
| 76 | Puesto que la probabilidad [[LatexEquation(p_i)]] no puede ser mayor que 1 tendrá que cumplir la siguiente restricción [[BR]] [[BR]] |
| 77 | [[LatexEquation( \lambda_{1}\leq-\underset{i=S'}{\max}\left\{ \ln\left(\pi_{i}+\underset{j=1}{\overset{k}{\prod}}\pi_{i,j}\right)+n\ln r_{i,k}+\xi_{i}\right\} )]] [[BR]] |
57 | 78 | |
58 | | Buscaremos el valor de [[LatexEquation(\lambda_1)]] que maximiza la verosimilitud aproximada |
59 | | [[LatexEquation( \underset{\lambda_{1}\leq\lambda_{2}}{\max}\left\{ \underset{i=1}{\overset{S'}{\sum}}s_{i}\ln\left(\tilde{P}_{i}\left(\lambda_{1}\right)\right)\right\} )]] [[BR]] |
60 | | |
| 79 | |
61 | 80 | == Test de super-población == |
62 | 81 | |
… |
… |
|
65 | 84 | |
66 | 85 | |
67 | | |