Lección 9Busquemos asociaciones

Busquemos asociaciones en los datos.

Metas de aprendizaje:

  • Puedo identificar los mismos datos representados en un gráfico de barras, en un gráfico de barras segmentadas y en una tabla de doble entrada.
  • Puedo utilizar una tabla de frecuencias de doble entrada o una tabla de frecuencias relativas para hallar asociaciones entre variables.

9.1 Observa y pregúntate: asociación con barras

¿Qué observas? ¿Qué te preguntas?

9.2 Clasificación de tarjetas con representaciones que se corresponden

Tu profesor repartirá algunas tarjetas.

Algunas tarjetas muestran tablas de doble entrada como esta:

tiene teléfono celular no tiene teléfono celular total
10 a 12 años 25 35 60
13 a 15 años 40 10 50
16 a 18 años 50 10 60
total 115 55 170

Algunas tarjetas muestran gráficos de barras como este:

Algunas tarjetas muestran gráficos de barras segmentadas como este:

Se han quitado las etiquetas de los gráficos de barras y de los gráficos de barras segmentadas.

  1. Pon todas las tarjetas que describen la misma situación en el mismo grupo.

  2. Uno de los grupos no tiene una tabla de doble entrada. Elabora una tabla de doble entrada para la situación descrita en los gráficos de ese grupo.

  3. Etiqueta los gráficos de barras y los gráficos de barras segmentadas de tal forma que queden indicadas las categorías representadas por cada barra.

  4. Con tus propias palabras, describe el tipo de información que se muestra en un gráfico de barras segmentadas.

¿Estás listo para más?

Hace falta uno de los gráficos de barras segmentadas. Elabora un gráfico de barras segmentadas que corresponda con las otras representaciones.

9.3 Elaboremos otro tipo de tabla de doble entrada

Esta es una tabla de doble entrada que muestra datos sobre el uso de teléfonos celulares entre niños de 10 a 18 años de edad.

tiene teléfono celular no tiene teléfono celular total
10 a 12 años 25 35 60
13 a 15 años 40 10 50
16 a 18 años 50 10 60
total 115 55 170
  1. Completa la tabla. En cada fila, las entradas para "tiene teléfono celular" y "no tiene teléfono celular" deben tener el 100% total. Redondea las entradas al punto porcentual más cercano.

    tiene teléfono celular no tiene teléfono celular total
    10 a 12 años 42%
    13 a 15 años 100%
    16 a 18 años 17%

    Esta todavía es una tabla de doble entrada. En lugar de mostrar frecuencias, esta tabla muestra frecuencias relativas.

  2. A menudo, las tablas de doble entrada que muestran frecuencias relativas no incluyen una fila de "total" en la parte inferior. ¿Por qué?
  3. ¿Hay una asociación entre la edad y el uso de teléfonos celulares? ¿Cómo ayuda la tabla de doble entrada de frecuencias relativas a ilustrar esto?

¿Estás listo para más?

Un encuestador va a una manifestación y encuesta a varios participantes sobre si están asociados con el partido político A o con el partido político B y sobre si están a favor o en contra de la proposición 3.14, que pronto se someterá a votación. Los resultados están agrupados en la tabla que se muestra a continuación.

a favor en contra
partido A 832 165
partido B 80 160
  • Un canal de noticias reporta estos resultados diciendo: "Una encuesta muestra que el mismo número de personas de ambos partidos votarán en contra de la proposición 3.14".
  • Un segundo canal de noticias muestra este gráfico.
  1. ¿Alguno de estos reportes es engañoso? Explica tu razonamiento.
  2. Elabora un titular, un gráfico y una breve descripción que representen los datos de la tabla con más precisión.

Resumen de la lección 9

Cuando recolectamos datos al contar objetos de varias categorías, como rojo, azul o amarillo, los llamamos datos categóricos y decimos que el color es una variable categórica.

Podemos usar tablas de doble entrada para investigar las posibles conexiones entre dos variables categóricas. Por ejemplo, esta tabla de doble entrada de frecuencias muestra los resultados de un estudio de meditación y estado mental de unos atletas antes de ir a la pista.

meditaron no meditaron total
calmados 45 8 53
agitados 23 21 44
total 68 29 97

Si nos interesa la pregunta de si hay alguna asociación entre meditar y estar calmado, podemos presentar las frecuencias en un gráfico de barras, agrupando los datos de los atletas que meditaron y agrupando los datos de los que no meditaron, así que podemos comparar los números de los atletas que estaban calmados y de los que estaban agitados en cada grupo.


 
Observa que el número de atletas que no meditaron es pequeño en comparación con el número de atletas que meditaron (29 en comparación con 68, como se muestra en la tabla).

Si queremos conocer las proporciones de meditadores calmados y de no meditadores calmados, podemos elaborar una tabla de doble entrada de frecuencias relativas y presentar las frecuencias relativas en un gráfico de barras segmentadas.

meditaron no meditaron
calmados 66% 28%
agitados 34% 72%
total 100% 100%

Términos del glosario

frecuencia relativa

La frecuencia relativa de una categoría indica la proporción en la cual esa categoría ocurre en un conjunto de datos. Se representa como una fracción o un porcentaje del número total.

Había 21 perros en el parque. Algunos eran de color blanco, otros de color marrón, otros de color negro y otros eran multicolor. La tabla muestra la frecuencia y la frecuencia relativa de cada color. La frecuencia relativa también se puede expresar como un decimal o un porcentaje.

color frecuencia frecuencia relativa
blanco 5 5/21 = 24%
marrón 7 7/21 = 33%
negro 3 3/21 = 14%
multicolor 6 6/21 = 29%
gráfico de barras segmentadas

Un gráfico de barras segmentadas permite comparar dos categorías dentro de un conjunto de datos. La barra completa representa todos los datos dentro de una misma categoría. Cada barra está separada en partes (segmentos) que muestran el porcentaje de cada parte dentro de la categoría.

Este gráfico de barras segmentadas muestra el porcentaje de personas en distintos grupos de edad que tienen y no tienen un teléfono celular. Por ejemplo, entre las personas de 10 a 12 años de edad, aproximadamente 40% tiene celular y 60% no tiene celular.
tabla de doble entrada

Una tabla de doble entrada nos permite comparar dos variables categóricas.

Esta muestra a una de las variables en las columnas y a la otra variable en las filas. Cada entrada en la tabla es la frecuencia o la frecuencia relativa de la categoría que definen los encabezados de esa columna y esa fila. 

Un estudio investiga la conexión entre la meditación y el estado de ánimo de los atletas antes de una competencia. Esta tabla de doble entrada muestra los resultados del estudio. 

meditó no meditó total
calmado 45 8 53
agitado 23 21 44
total 68 29 97

Problemas de práctica de la lección 9

  1. Un científico quiere saber si el color del agua afecta la cantidad de agua que beben los animales. La cantidad de agua promedio que bebe cada animal se registró en mililitros durante una semana y luego se graficó. ¿Hay evidencia que sugiera que hay una asociación entre el color del agua y el animal?

    consumo del gato (ml) consumo del perro (ml) total (ml)
    agua azul 210 1200 1410
    agua verde 200 1100 1300
    total 410 2300 2710
  2. Un agricultor lleva sus productos al mercado agrícola y anota si las personas compran lechuga, manzanas, ambas u otra cosa.

    compró manzanas no compró manzanas
    compró lechuga 14 58
    no compró lechuga 8 29
    Elabora una tabla que muestre las frecuencias relativas para cada fila. Utiliza esta tabla para determinar si hay alguna asociación entre comprar lechuga y comprar manzanas.
  3. Los investigadores de una empresa de comunicación quieren estudiar los hábitos de lectura de noticias entre algunos grupos de distintas edades. Ellos rastrearon los datos sobre las suscripciones a versiones impresas y a versiones en línea de las noticias y elaboraron una tabla de doble entrada.

    artículos de internet artículos impresos
    personas de 18 a 25 años 151 28
    personas de 26 a 45 años 132 72
    personas de 45 a 65 años 48 165
    1. Elabora un gráfico de barras segmentadas utilizando una barra para cada fila de la tabla.
    2. ¿Hay alguna asociación entre los grupos de personas por edades y el método que utilizan para leer los artículos? Explica tu razonamiento.
  4. Usando los datos en el diagrama de dispersión, ¿cuál es una pendiente razonable para un modelo que se ajusta a estos datos?

    1. -2.5
    2. -1
    3. 1
    4. 2.5