Opened 15 years ago
Last modified 15 years ago
#893 new trick
Chequeo de la calidad en la estimación de modelos estadísticos — at Initial Version
Reported by: | Víctor de Buen Remiro | Owned by: | Víctor de Buen Remiro |
---|---|---|---|
Priority: | normal | Milestone: | BSR Diagnosis |
Component: | Math | Version: | |
Severity: | normal | Keywords: | |
Cc: |
Description
Cuando se desarrolla cualquier tipo de estimador de modelos estadísticos que se pretenda robusto y eficaz, es necesario contar con una batería de pruebas lo más completa que sea posible que abarque al menos estos tres tipos de casos:
- Ejemplos prácticos similares a aquellos a los que se enfrentará el programa en la vida real y de los cuales se tenga una solución aceptada previamente para poder comparar.
- Ejemplos patológicos, es decir, casos que se sabe que son realmente complicados por su tamaño o su estructura, y que con frecuencia hacen fracasar a los enfoques menos sofisticados.
- Ejemplos arbitrarios generados de forma aleatoria para cubrir un espectro lo más amplio posible mediante ingeniería inversa, siguiendo los siguientes pasos conceptuales:
- se generan las componentes estocásticas independientes, residuos, varianzas, etc.; según la distribución que toque, usualmente multinormales o uniformes independientes .
- se generan los parámetros del modelo de forma compatible con su definición y abarcando toda la región factible en la medida de los posible. En principio suele bastar con tomar uniformes independientes o alguna transformación polinómica de las mismas.
- se genera la información auxiliar externa como filtrados, inputs, omitidos, censuras, etc.
- se genera el output sin más que aplicar la fórmula del modelo a todos los datos y parámetros que han sido creados anteriormente de forma arbitraria, y a los que llamaremos valores reales del chequeo.
Este último tipo de chequeo es el que introduce mayor robustez si se tiene cuidado en que la generación arbitraria tenga sentido y cree modelos que exploren de forma exhaustiva la clase de modelos objetivo del estimador.
Al disponer de los valores reales es posible contrastar con ellos de forma objetiva los resultados del modelo estimado, aunque no es desde luego nada trivial en modelos no lineales o muy correlados, ya que en tales casos puede haber soluciones tan buenas o mejores como la real en puntos que no tienen que estar necesariamente cerca de la misma.
cmp_res