close Warning: Can't synchronize with repository "(default)" (/var/svn/tolp does not appear to be a Subversion repository.). Look in the Trac log for more information.

Changes between Initial Version and Version 1 of OfficialTolArchiveNetworkLinAproxNonLinReg


Ignore:
Timestamp:
Dec 28, 2011, 12:10:16 AM (13 years ago)
Author:
Víctor de Buen Remiro
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • OfficialTolArchiveNetworkLinAproxNonLinReg

    v1 v1  
     1= Aproximación continua de relaciones no lineales en una regresión bayesiana =
     2
     3Los problemas de regresión no lineal no pueden ser estimados directamente si no se conoce la forma paramétrica de la familia de funciones a la que debería pertenecer la relación no lineal en cuestión.
     4
     5Este problema suele resolverse estimando por tramos en los que la función es aproximadamente lineal, formando una línea poligonal que ajuste la relación no lineal desconocida. Este enfoque poligonal por tramos tiende a dar serios problemas de estimación en modelos complejos:
     6 * falta de continuidad
     7 * posible falta de muestra en ciertos tramos
     8 * introducción de multicolinearidad inherente al proceso de
     9   construcción de los inputs por tramos
     10 * exceso de restricciones deterministas para obtener las formas esperadas.
     11
     12Además no se trata de problemas independientes entre sí sino que se potencian los unos a los otros, hasta el punto de hacer inviable una estimación adecuada, especialmente si hay varias relaciones no lineales en un mismo modelo que pueden estar correlacionadas entre sí.
     13
     14Aquí se describe un sistema de aproximación lineal continua con el que parametrizar relaciones no lineales dentro de un bloque lineal de regresión con restricciones e información a priori, que permitan darle la forma adecuada a la curva esperada sin perder por ello flexibilidad de ajuste, y reduciendo al mismo tiempo los problemas referidos.
     15
     16Se trata de aproximar la función no lineal desconocida mediante una combinación lineal de funciones de una base de funciones ortogonales y de clase al menos C2 en el intervalo [l,u] de dominio del input, o como mínimo que sean poco correladas.
     17{{{
     18   f  (x) = F  [1](x)*b[1] + F  [2](x)*b[2] + ... + F  [n]*b[n]
     19   f' (x) = F' [1](x)*b[1] + F' [2](x)*b[2] + ... + F' [n]*b[n]
     20   f''(x) = F''[1](x)*b[1] + F''[2](x)*b[2] + ... + F''[n]*b[n] 
     21}}}
     22
     23En un primer ataque se incluyen aproximaciones basadas en familias de polinomios ortogonales como los de Legendre o los de Chebyshov, que deberían funcionar sin problemas para formas con pocos puntos extremos y de inflexión, que es lo que nos solemos encontrar por lo que he podido ver en los casos que me han mostrado. Más tarde se podrían incluir familias trigonométricas como la de Fourier para aproximar funciones cíclicas o familias de splines para formas complejas.
     24
     25La idea fundamental es que se puedan expresar de una forma natural informaciones conocidas o postuladas a priori, tanto de forma determinista como probabilista tales como:
     26 * determinista:
     27  * debe ser creciente en un punto dado,
     28  * debe ser convexa en tal otro,
     29  * debe ser mayor en un punto que en otro
     30  * ...
     31 * probabilista:
     32  * debe haber un máximo local cercano a un punto dado
     33  * debe haber un mínimo local cercano a un punto dado
     34  * debe haber un punto de inflexión cercano a un punto dado
     35  * debe haber un punto de radio de curvatura mínimo cercano a un
     36    punto dado
     37  * la diferencia de valor entre dos puntos está en torno a cierta
     38    cantidad
     39  * ...
     40
     41Todas estas características se pueden expresar analíticamente como combinaciones lineales de los parámetros b construidas a partir de evaluaciones de las funciones básicas o sus derivadas en los puntos propuestos, por lo que se pueden imbricar en cualquier estimador bayesiano, en particular BSR y WgtProbit.
     42
     43Estye paquete contiene una clase para generar inputs linealizados de esta forma, con métodos ad-hoc para añadir cada tipo de información construyendo las ecuaciones de forma transparente para el usuario.
     44
     45A nivel de interfaz, se podría pensar en una forma de visualizar una batería de plantillas de formas para elegir la que más se parezca a lo que se busca y que internamente se representaría como un listado de características como las que se han enumerado.
     46
     47Otra funcionalidad bastante útil sería poder visualizar curvas válidas simuladas aleatoriamente para un generador de inputs ya diseñado para comprobar que efectivamente todas tienen las características geométricas que se están buscando, pues la intuición a veces es engañosa y una imagen vale más que mil palabras.
     48
     49