miércoles, 28 de noviembre de 2012

Regresión y Correlación



Regresión es una palabra un tanto rara. La utilizan los biólogos, los médicos, los psicólogos... y suena como  "ir hacia atrás", "volver al pasado", y  realmente este es verdadero significado del vocablo.Fue un biólogo y estadístico inglés, SIR FRANCIS GALTON, quien introdujo en 1889 el término regresión en Estadística. Empleó este concepto para indicar la relación que existía entre la estatura de los niños de una muestra y  la estatura de su  padre.
Observó, que si los padres son  altos, los hijos generalmente también  lo son, y si los padres son  bajos los hijos son  también  de menor estatura. Pero  ocurría un  hecho curioso: cuando el padre es muy alto o muy bajo, aparece una perceptible "regresión"hacia la estatura media de la población, de modo  que sus hijos retroceden hacia la media de la que sus padres, por cierto, están muy alejados. Hoy día, el término no se utiliza en ese sentido.En muchas ocasiones, se desea conocer algo acerca de la relación o dependencia entre dos características cuantitativas, o  másde una, consideradas sobre la misma población objeto de estudio (por ejemplo la talla y el peso). Hay muchos casos en los que ya de antemano se "sospecha" que puede existir algún  tipo  de relación, y  por consiguiente, se pretende saber por ejemplo, en el caso de que tengamos 
únicamente dos variables:
1.- Si ambas variables están  realmente relacionadas entre sí o  si, por el
contrario, pueden considerarse independientes.
2.- Si existe dependencia, es necesario  conocer el "grado  de relación", así
como el "tipo" de relación entre ambas.
3.- Si puede predecirse la variable que es considerada como  dependiente a
partir de los valores de la otra, que es considerada independiente, y si es así,con qué precisión.

¿Cuándo existe regresión?
De una forma general, lo  primero  que suele hacerse para ver si dos variables
aleatorias están relacionadas o  no  (de ahora en  adelante las llamaremos X e Y,
denotando con Y a la variable dependiente, y X a la variable independiente o regresora),consiste en tomar una muestra aleatoria. Sobre cada individuo de la muestra se analizan las dos características en estudio, de modo que para cada individuo tenemos un 


Tipos de regresión
Si las dos variables X e Y se relacionan  según  un  modelo  de línea recta,
hablaremos de Regresión Lineal Simple: Y=a+bx.
Cuando las variables X e Y se relacionan según  una línea curva, hablaremos de
Regresión no lineal o curvilínea. Aquí podemos distinguir entre Regresión parabólica,Exponencial, Potencial, etc.Cuando tenemos más de una variable independiente (X1, X2,..., Xp), y una sola variable dependiente Y, hablaremos de Regresión múltiple, que, se las denomina, regresoras, predictoras o independientes.

Análisis de Correlación: El análisis de correlación emplea métodos para medir la significación del grado o intensidad de asociación entre dos o más variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión. El concepto de correlación está estrechamente vinculado al concepto de regresión, pues, para que una ecuación de regresión sea razonable los puntos muéstrales deben estar ceñidos a la ecuación de regresión; además el coeficiente de correlación debe ser:

- Grande cuando el grado de asociación es alto (cerca de +1 o -1, y pequeño cuando- Es bajo, cerca de cero.- Independiente de las unidades en que se miden las variables.






No hay comentarios:

Publicar un comentario