Lección 4 Dominemos los residuos Consolido lo que aprendí
Focos de aprendizaje
Entender e interpretar los residuos.
¿Todos los datos bivariados deben modelarse con una función lineal?
¿Hay otras maneras de saber si un modelo lineal es adecuado, además de usar un coeficiente de correlación?
Indicaciones de uso de tecnología para la lección de hoy:
- Explorar los residuos de un conjunto de datos: Casio ClassPad Casio fx-9750GIII
Descubramos las matemáticas: Introducción, Exploración, Discusión
El coeficiente de correlación no es la única herramienta que usan los especialistas en estadística para analizar si una recta es un buen modelo de los datos. Ellos también tienen en cuenta los residuos, que son las diferencias entre los valores observados (los datos reales) y los valores que se predijeron (los valores de
Comencemos con algunos datos:
Hagamos un diagrama de dispersión y grafiquemos la recta de regresión. En este caso, la recta es
Dibujemos un segmento de recta vertical desde cada punto hasta la recta de regresión. Así, obtenemos los segmentos que vemos en la siguiente gráfica.
1.
Los residuos corresponden a las longitudes de los segmentos. ¿Cómo puedes calcular la longitud de cada segmento para obtener los residuos?
2.
Por lo general, si un punto de datos está por encima de la recta de regresión, el residuo correspondiente es positivo. Si el punto de datos está por debajo de la recta, el residuo es negativo. Teniendo esto en cuenta, usa tu plan del problema 1 para crear una tabla con los valores de los residuos para todos los puntos de datos.
3.
A los especialistas en estadística les gusta observar las gráficas de los residuos para saber qué tan buenas son sus rectas de regresión. Tú puedes hacer lo mismo. Grafica los residuos.
Ahora que ya hiciste una gráfica de residuos, piensa en qué información nos dan los residuos y responde los siguientes problemas.
4.
¿Qué significa que un residuo sea grande y negativo?
5.
¿Qué significa que un residuo sea igual a
6.
Si alguien te dice que estimó una recta de mejor ajuste para un conjunto de puntos de datos y que todos los residuos son positivos, ¿qué le dirías?
7.
Si el coeficiente de correlación de un conjunto de datos es igual a
Un especialista en estadística usa gráficas de residuos para averiguar si en los datos hay patrones que no predijo su modelo. ¿Qué patrones puedes identificar en las siguientes gráficas de residuos que parezcan indicar que la recta de regresión no es un buen modelo de los datos? Con base en la gráfica de residuos, ¿hay puntos que pueden considerarse datos atípicos?
8.
9.
10.
11.
¿Listo para más?
Usa la gráfica de residuos del problema 10 para reconstruir el diagrama de dispersión en la siguiente gráfica, que muestra la recta de regresión.
La recta de regresión tiene un coeficiente de correlación positivo. ¿Los residuos del problema 10 pueden representar también datos que tienen un coeficiente de correlación negativo?
Aprendizajes
Vocabulario
- residuos, gráfica de residuos
- Los términos en negrita son nuevos en esta lección.
Resumen de la lección
En esta lección aprendimos que un residuo muestra la diferencia entre el valor de
Usa el diagrama de caja para responder los problemas del 1 al 4.
1.
¿Cuál es el resumen de cinco números (mínimo, Q1, mediana, Q3, máximo) de este diagrama de caja?
2.
¿Qué proporción del conjunto de datos está representado en la caja?
3.
¿Qué proporción de los datos está representado en uno de los bigotes del diagrama?
4.
¿Por qué el lado izquierdo de la caja es más pequeño que el lado derecho de la caja?