Tema 12: Concordancia y correlación
REGRESIÓN
La regresión fue introducida por Francis Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”. "Cada particularidad de un hombre es compartida por sus descendientes, pero en media, en un grado menor"
REGRESIÓN A LA MEDIA
Descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable).
Pearson (su amigo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo:
- Altura del hijo =85cm + 0,5 altura del padre (aprox)
- Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos.
RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS
¿CÓMO RELACIONAR AMBAS VARIABLES?
- NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN: se trata de un gráfico donde los pares ordenados están representados. Ayuda a determinar si la regresión lineal es aplicable. Si lo es, los puntos deberán mostrar una notable tendencia a la linealidad.
RELACIÓN DIRECTA E INVERSA
- INCORRELACIÓN: para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares.
- FUERTE RELACIÓN DIRECTA: para valores de X mayores que la media corresponden valores de Y mayores también. Para valores de X menores que la media corresponden valores de Y menores también.
- CIERTA RELACIÓN INVERSA: para valores de X mayores que la media le corresponden valores de Y menores.
REGRESIÓN LINEAL
Se trata de estudiar la asociación lineal entre dos variables cuantitativas. Por ejemplo, la influencia de la edad en las cifras de Tensión arterial Sistólica
- REGRESIÓN LINEAL SIMPLE: una sóla variable independiente
- REGRESIÓN LINEAL MÚLTIPLE: más de una variable independiente
Todo parte de la ecuación de la recta: y=ax+b (ej: TAS =a x edad + b).
- La pendiente de la recta a= B1, cuanto más negativa sea, más decreciente es la recta.
- Punto de intersección con el eje de coordenadas b = B0.
- B1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente. Se refiere a cuanto sube la tensión arterial cuando la persona aumenta un año la edad.
- B0 expresa cual es el valor de la variable dependiente cuando la independiente vale 0.
COEFICIENTES DE CORRELACIÓN
- Coeficiente de correlación de Pearson: paramétricas,por lo que requiere que la distribución siga la normalidad. Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde –1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.
Y= B1 *x + B0 (Determinista) Y= B1 *x + B0 + e1 (Probabilista)
Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente.
Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1
No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el comportamiento de la variable dependiente en función de la variable independiente
- Coeficiente de correlación de Sperman: No paramétricas, no sigue la normalidad. Si tiene solo una variable que sigue una distribución normal o ninguna.
Comentarios
Publicar un comentario