Lección 15Cuartiles y rango intercuartil

Estudiemos otras medidas para describir las distribuciones.

Metas de aprendizaje:

  • Cuando hay una lista de valores de datos dada o un diagrama de puntos, puedo hallar los cuartiles y el rango intercuartil (IQR) para los datos.
  • Puedo utilizar el IQR para describir la dispersión de los datos.
  • Sé qué miden los cuartiles y el rango intercuartil (IQR), y lo que nos dicen sobre los datos.

15.1 Observa y pregúntate: dos fiestas

Estos son dos diagramas de puntos que incluyen la media marcada con un triángulo. Cada uno muestra las edades de los asistentes a una fiesta.

Two dot plots for “age in years,” labeled “data set A” and “data set B”. On each dot plot, the numbers 5 through 45, in increments of 5, are indicated. There is a red triangle indicated at 15 on “data set A” and at 20 on “data set B”.  The data for “data set A” are as follows: 8 years, 12 dots. 10 years, 3 dots. 12 years, 1 dot. 15 years, red triangle. 36 years, 1 dot. 42 years, 1 dot. 44 years, 2 dots.  The data for “data set B” are as follows: 7 years, 1 dot. 8 years, 1 dot. 9 years, 1 dot. 10 years, 2 dots. 15 years, 1 dot. 16 years, 1 dot. 20 years, 2 dots and 1 red triangle. 22 years, 1 dot. 23 years, 1 dot. 24 years, 1 dot. 28 years, 1 dot. 30 years, 1 dot. 33 years, 1 dot. 35 years, 1 dot. 38 years, 1 dot. 42 years, 1 dot.
¿Qué observas y qué te preguntas sobre las distribuciones mostradas en los dos diagramas de puntos?

15.2 El resumen de cinco números

Estas son las edades del grupo de 20 asistentes a la fiesta que viste anteriormente, mostradas en orden de menor a mayor:

7 8 9 10 10 11 12 15 16 20 20 22 23 24 28 30 33 35 38 42
    1. Halla y marca la mediana en la tabla y etiquétala como "percentil 50". Los datos ahora están divididos en una mitad superior y una mitad inferior.

    2. Halla y marca el valor del medio de la mitad inferior de los datos, sin incluir la mediana. Si hay un número par de valores, halla y escribe el promedio de los dos valores del medio. Etiqueta este valor como "percentil 25".

    3. Halla y marca el valor del medio de la mitad superior de los datos, sin incluir la mediana. Si hay un número par de valores, halla y escribe el promedio de los dos valores del medio. Etiqueta el valor como "percentil 75".

    4. Ahora has dividido el conjunto de datos en cuatro partes. Cada uno de los tres valores que "separan" los datos se llama un cuartil.

      • El primer cuartil (o cuartil inferior) es la marca del percentil 25. Escribe "Q1" al lado de "percentil 25".
      • El segundo cuartil es la mediana. Escribe "Q2" al lado de esa etiqueta.
      • El tercer cuartil (o cuartil superior) es la marca del percentil 75. Escribe "Q3" al lado de esa etiqueta.
    5. Etiqueta el menor valor del conjunto como "mínimo" y el mayor valor como "máximo".

  1. Anota los cinco valores que acabas de identificar. Estos forman el resumen de cinco números de los datos.

    Mínimo: _____     Q1: _____     Q2: _____     Q3: _____     Máximo: _____

  2. El valor de la mediana (o Q2) de este conjunto de datos es 20. Esto nos dice que la mitad de los asistentes a la fiesta tiene 20 años o menos y la otra mitad tiene 20 años o más. ¿Qué nos dice cada uno de los siguientes valores sobre las edades de los asistentes a la fiesta?

    1. Q3
    2. El mínimo
    3. El máximo

¿Estás listo para más?

Este es el resumen de cinco números de la distribución de las edades en otra fiesta de 21 personas:

Mínimo: 5 años    Q1: 6 años     Q2: 27 años    Q3: 32 años     Máximo: 60 años

  1. ¿Crees que esta fiesta tiene más o menos niños que la otra fiesta de esta actividad? Explica tu razonamiento.
  2. En esta fiesta, ¿hay más niños o más adultos? Explica tu razonamiento.

15.3 Rango y rango intercuartil

  1. Este es un diagrama de puntos que viste en una tarea anterior. Muestra cuánto tiempo en minutos tardó el bus de Elena en llegar a la escuela durante 12 días.

    A dot plot labeled “travel time in minutes.” The numbers 5 through 14 are indicated. The data is as follows.  5 minutes, 0 dots 6 minutes, 2 dots 7 minutes, 1 dot 8 minutes, 3 dots 9 minutes, 3 dots 10 minutes, 2 dots 11 minutes, 0 dots 12 minutes, 1 dot 13 minutes, 0 dots 14 minutes, 0 dots

    Escribe el resumen de cinco números de este conjunto de datos hallando el mínimo, Q1, Q2, Q3 y el máximo. Muestra tu razonamiento.

  2. El rango de un conjunto de datos es una forma de describir la dispersión de los valores del conjunto. Es la diferencia entre el valor mayor y el valor menor de los datos. ¿Cuál es el rango de los datos de Elena?

  3. Otro número que se utiliza comúnmente para describir la dispersión de los valores en un conjunto de datos es el rango intercuartil (IQR), que es la diferencia entre Q1, el cuartil inferior, y Q3, el cuartil superior.

    1. ¿Cuál es el rango intercuartil (IQR) de los datos de Elena?

    2. ¿Qué fracción de los valores de datos está entre los cuartiles inferior y superior? Utiliza tu respuesta para completar la siguiente afirmación:

      El rango intercuartil (IQR) es la longitud que contiene la ______ central de los valores en un conjunto de datos.

  4. Estos son dos diagramas de puntos que representan dos conjuntos de datos:

    Two dot plots for two data sets, labeled “data set A” and “data set B”. On each dot plot, the numbers 14 through 28, in increments of 2, are indicated.  The data for “data set A” are as follows: 14, 0 dots. 15, 1 dot. 16, 3 dots. 17, 3 dots. 18, 1 dot. 19, 0 dots. 20, 0 dots. 21, 3 dots. 22, 1 dot. 23, 2 dots. 24, 3 dots. 25, 3 dots. 26, 1 dot. 27, 3 dots. 28, 1 dot.  The data for “data set B” are as follows: 14 through 22, 0 dots. 23, 3 dots. 24, 3 dots. 25, 8 dots. 26, 2 dots. 27, 6 dots. 28, 3 dots.

    Sin hacer cálculos, predice:

    a. ¿Cuál conjunto de datos tiene el IQR más pequeño? Explica tu razonamiento.

    b. ¿Cuál conjunto de datos tiene el rango más pequeño? Explica tu razonamiento.

  1. Comprueba tus predicciones calculando el IQR y el rango para los datos de cada diagrama de puntos.

Resumen de la lección 15

Antes aprendimos que la media es una medida del centro de una distribución y la MAD es una medida de la variabilidad (o dispersión) que va con la media. También hay una medida de la dispersión asociada con la mediana, llamada el rango intercuartil (IQR).

Para hallar el IQR debemos dividir el conjunto de datos en cuartos. Cada uno de los tres valores que separan los datos en cuartos se llama cuartil.

  • La mediana, que separa el conjunto de datos en una mitad inferior y una mitad superior, es el segundo cuartil (Q2).
  • El primer cuartil (Q1) es el valor del medio de la mitad inferior de los datos.
  • El tercer cuartil (Q3) es el valor del medio de la mitad superior de los datos.

Este es un conjunto de datos con 11 valores:

12 19 20 21 22 33 34 35 40 40 49
Q1 Q2 Q3
  • La mediana (Q2) es 33. 
  • El primer cuartil (Q1) es 20, la mediana de los números menores que 33.
  • El tercer cuartil (Q3) es 40, la mediana de los números mayores que 33.

La diferencia entre los valores mínimo y máximo de un conjunto de datos es el rango.

La diferencia entre Q1 y Q3 es el rango intercuartil (IQR). Como la distancia entre Q1 y Q3 incluye a los dos cuartos que están en medio de la distribución, los valores que están entre esos dos cuartiles a veces se llaman la mitad central de los datos.

Mientras más grande sea el IQR, más dispersa es la mitad central de los datos. Mientras más pequeño sea el IQR, más cercanos son los datos de la mitad central. Por esta razón, consideramos al IQR como una medida de la dispersión.

Un resumen de cinco números, que incluye al mínimo, a Q1, a Q2, a Q3 y al máximo, se puede utilizar para sintetizar una distribución.

Los cinco números en este ejemplo son 12, 20, 33, 40 y 49. Sus ubicaciones se marcan con diamantes en el siguiente diagrama de puntos:

A dot plot. The numbers 10 through 50, in increments of 5, are indicated. There are diamonds indicated at 12, 20, 33, 40 and 49. The data are as follows: 12, 1 dot; 19, 1 dot; 20, 1 dot; 21, 1 dot; 22, 1 dot; 33, 1 dot; 34, 1 dot; 35, 1 dot; 40, 1 dot; 49, 2 dots.

Distintos conjuntos de datos pueden tener el mismo resumen de cinco números. Por ejemplo, los siguientes datos tienen los mismos máximo, mínimo y cuartiles que los datos de arriba:

A dot plot. The numbers 10 through 50, in increments of 5, are indicated. There are diamonds indicated at 12, 20, 33, 40, and 49. The data are as follows: 12, 1 dot; 14, 1 dot; 16, 1 dot; 18, 1 dot; 20, 1 dot; 24, 1 dot; 26, 1 dot; 28, 1 dot; 31, 1 dot; 33, 2 dots; 36, 1 dot; 38, 1 dot; 39, 1 dot; 40, 1 dot; 44, 1 dot; 46, 1 dot; 48, 1 dot; 49, 1 dot.

Términos del glosario

cuartil

Los cuartiles son los números que separan un conjunto de datos ordenado de menor a mayor en cuatro partes, cada una con igual cantidad de datos.

Por ejemplo, en este conjunto de datos el primer cuartil es 20. El segundo cuartil es lo mismo que la mediana, que es 33. El tercer cuartil es 40.

12 19 20 21 22 33 34 35 40 40 49
Q1 Q2 Q3
rango

El rango es la distancia entre el valor más pequeño y el valor más grande en un conjunto de datos. Por ejemplo, en el conjunto de datos 3, 5, 6, 8, 11, 12, el rango es 9 porque  12-3=9 .

rango intercuartil (IQR)

El rango intercuartil es una forma de medir qué tan dispersos están los datos. A menudo nos referimos a este como el IQR (por sus siglas en inglés). Para encontrar el rango intercuartil restamos el valor del primer cuartil del valor del tercer cuartil.

22 29 30 31 32 43 44 45 50 50 59
Q1 Q2 Q3

Por ejemplo, el IQR de este conjunto de datos es 20 porque  50 - 30 = 20 .

Problemas de práctica de la lección 15

  1. Supongamos que hay 20 números en un conjunto de datos y que todos son diferentes.

    1. ¿Cuántos valores de este conjunto de datos están entre el primer cuartil y el tercer cuartil?
    2. ¿Cuántos valores de este conjunto de datos están entre el primer cuartil y la mediana?
  2. En un juego de palabras, 1 letra vale 1 punto. Este diagrama de puntos muestra los puntajes para 20 palabras comunes.

    1. ¿Cuál es la mediana de los puntajes?
    2. ¿Cuál es el primer cuartil (Q1)?
    A dot plot for “word value in points”. The numbers 0 through 22, in increments of 2, are indicated. The data are as follows:  0 points, 0 dots 1 point, 0 dots 2 points, 0 dots 3 points, 0 dots 4 points, 4 dots 5 points, 2 dots 6 points, 4 dots 7 points, 3 dots 8 points, 3 dots 9 points, 3 dots 10 through 21 points, 0 dots 22 points, 1 dot
    1. ¿Cuál es el tercer cuartil (Q3)?
    2. ¿Cuál es el rango intercuartil (IQR)?
  3. Estos son cinco diagramas de puntos que muestran las cantidades de tiempo que tardan diez estudiantes de sexto grado en cinco países para llegar a la escuela. Empareja cada diagrama de puntos con la mediana y el IQR apropiados.

    Five dot plots for "travel time in minutes" labeled “United States”, “Canada”, “Australia”, “New Zealand”, and “South Africa”. Each dot plot has the numbers 0 through 60, in increments of 10. There are also tick marks midway between.  The approximate data for "United States" are as follows: 2 minutes, 2 dots; 7 minutes, 2 dots; 8 minutes, 3 dots; 11 minutes, 1 dot; 17 minutes, 1 dot; 20 minutes, 1 dot. The approximate data for "Canada" are as follows:  1 minute, 1 dot; 2 minutes, 1 dot; 5 minutes, 2 dots; 7 minutes, 2 dots; 10 minutes, 1 dot; 15 minutes, 1 dot; 28 minutes, 1 dot; 30 minutes, 1 dot. The approximate data for "Australia" are as follows:  5 minutes, 1 dot; 7 minutes, 1 dot; 9 minutes, 1 dot; 15 minutes, 2 dots; 20 minutes, 3 dots; 25 minutes, 1 dot; 45 minutes, 1 dot. The approximate data for "New Zealand" are as follows:  3 minutes, 1 dot; 6 minutes, 1 dot; 7 minutes, 1 dot; 10 minutes, 2 dots; 15 minutes, 3 dots; 20 minutes, 1 dot; 24 minutes, 1 dot. The approximate data for "South Africa" are as follows: 5 minutes, 2 dots; 10 minutes, 2 dots; 15 minutes, 2 dots; 30 minutes, 1 dot; 40 minutes, 1 dot; 45 minutes, 1 dot; 60 minutes, 1 dot.
    1. Mediana: 17.5, IQR: 11
    2. Mediana: 15, IQR: 30
    3. Mediana: 8, IQR: 4
    4. Mediana: 7, IQR: 10
    5. Mediana: 12.5, IQR: 8
  4. Mai y Priya jugaron 10 juegos de bolos cada una y registraron los puntajes. La media de los puntajes de Mai fue 120 y su IQR fue 5. La media de los puntajes de Priya fue 118 y su IQR fue 15. ¿Qué puntajes, los de Mai o los de Priya, tuvieron probablemente menos variabilidad? Explica cómo lo sabes. 

  5. Dibuja y etiqueta un par de ejes adecuados y grafica los puntos.  A = (10, 50) , B = (30, 25) , C = (0, 30) , D = (20, 35)

  6. Hay 20 monedas de centavo en un frasco. Si el 16% de las monedas en el frasco son monedas de centavo, ¿cuántas monedas hay en el frasco?