Regresión es una palabra un tanto rara. La utilizan los
biólogos, los médicos, los psicólogos... y suena como "ir hacia
atrás", "volver al pasado", y realmente este
es verdadero significado del vocablo.Fue un biólogo y estadístico inglés,
SIR FRANCIS GALTON, quien introdujo en 1889 el término regresión en
Estadística. Empleó este concepto para indicar la relación que existía
entre la estatura de los niños de una muestra y la estatura de su
padre.
Observó, que si los padres son altos, los hijos generalmente
también lo son, y si los padres son bajos los hijos son también de menor
estatura. Pero ocurría un hecho curioso: cuando el padre es muy alto o muy bajo, aparece una
perceptible "regresión"hacia la estatura media de la población, de modo que sus
hijos retroceden hacia la media de la que sus padres, por cierto, están muy alejados. Hoy
día, el término no se utiliza en ese sentido.En muchas ocasiones, se desea conocer algo acerca de la relación o
dependencia entre dos características cuantitativas, o másde una,
consideradas sobre la misma población objeto de estudio (por ejemplo la talla y el peso). Hay
muchos casos en los que ya de antemano se "sospecha" que puede existir algún
tipo de relación, y por consiguiente, se pretende saber por ejemplo, en el caso de que
tengamos
únicamente dos variables:
1.- Si ambas variables están realmente relacionadas entre sí
o si, por el
contrario, pueden considerarse independientes.
2.- Si existe dependencia, es necesario conocer el
"grado de relación", así
como el "tipo" de relación entre ambas.
3.- Si puede predecirse la variable que es considerada como
dependiente a
partir de los valores de la otra, que es considerada
independiente, y si es así,con qué precisión.
¿Cuándo existe regresión?
De una forma general, lo primero que suele hacerse
para ver si dos variables
aleatorias están relacionadas o no (de ahora en
adelante las llamaremos X e Y,
denotando con Y a la variable dependiente, y X a la variable
independiente o regresora),consiste en tomar una muestra aleatoria. Sobre cada individuo de
la muestra se analizan las dos características en estudio, de modo que para cada
individuo tenemos un
Tipos de
regresión
Si las
dos variables X e Y se relacionan según un modelo de
línea recta,
hablaremos
de Regresión Lineal Simple: Y=a+bx.
Cuando
las variables X e Y se relacionan según una línea curva, hablaremos de
Regresión
no lineal o curvilínea. Aquí podemos distinguir entre Regresión parabólica,Exponencial,
Potencial, etc.Cuando
tenemos más de una variable independiente (X1, X2,..., Xp), y una sola variable
dependiente Y, hablaremos de Regresión múltiple, que, se las denomina,
regresoras, predictoras o independientes.
Análisis de Correlación: El análisis de correlación emplea métodos para medir la significación del grado o intensidad de asociación entre dos o más variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión. El concepto de correlación está estrechamente vinculado al concepto de regresión, pues, para que una ecuación de regresión sea razonable los puntos muéstrales deben estar ceñidos a la ecuación de regresión; además el coeficiente de correlación debe ser: