Hallar el percentil 40

Rodrigo Ricardo Publicado el 23 noviembre, 2020 3 minutos y 49 segundos de lectura

Preparando el problema

Margaret es una nueva asistente de investigación para una empresa de investigación de mercado y acaba de recibir su primera tarea. A partir de un conjunto de datos que contiene 11 piezas de información, se supone que debe encontrar el percentil 40. Como veremos en la última sección, hay varias formas ligeramente diferentes de definir el percentil. Por ahora, definamos un percentil como el número más bajo en un conjunto de datos ordenados que es mayor o igual a un porcentaje específico de los otros números en un conjunto. En el caso de Margaret, quiere encontrar cuál de sus 11 puntos de datos sería mayor que el 40% de los números del conjunto. Echemos un vistazo más de cerca a cómo funciona esto en nuestro pequeño ejemplo.

  • Paso 1: obtén los datos

¿En qué datos se le pide que trabaje Margaret? Es una puntuación compuesta en una encuesta de limpieza que envió su empresa. Las puntuaciones son:

Datos
79 15 22 81 55 43 93 39 45 66 71

Los puntajes posibles en esta encuesta fueron los números enteros de 0 a 100.

  • Paso 2: cuente el número de puntos de datos

Este paso es bastante fácil para un pequeño conjunto de datos como este: hay exactamente 11 números en esta secuencia. Aunque este paso es simple, será importante más adelante.

  • Paso 3: organice los puntos de datos en orden ascendente

El siguiente paso es organizar nuestro conjunto de datos de menor a mayor.

Datos ordenados
15 22 39 43 45 55 66 71 79 81 93
  • Paso 4 – Calcule la posición del percentil 40

Para obtener la posición del percentil 40 en un conjunto de datos con 11 puntos de datos, simplemente multiplique nuestro percentil por la cantidad de puntos en nuestro conjunto de datos:

(0,40) (11) = 4,4

  • Paso 5: elija el punto de datos que satisfaga nuestra definición

Elegimos definir el percentil 40 como el número más bajo que es mayor o igual al 40% de los números en nuestro conjunto de datos de 11 números. Usando esta definición, terminamos descartando cualquier decimal obtenido en este paso. Entonces, tendremos que ir al cuarto número en nuestro conjunto de datos ordenados para obtener nuestra respuesta.

Solución

Dado que el cuarto número en nuestro conjunto de datos ordenado es 45, nuestra solución para este conjunto de datos y esta definición es 45. 45 es el número más pequeño de nuestro conjunto de números que es mayor o igual al 40% de los números de este conjunto.

Comprobando su trabajo

Generalmente, cuando calcula el percentil 40 de un conjunto de números, esperaría obtener algo un poco más pequeño que la mediana de ese conjunto. En nuestro caso, el número medio también es 55, porque hay exactamente 5 números más altos y 5 números más bajos. 45 es menor que esto, por lo que es un buen control. Sin embargo, esta verificación no siempre funcionará para conjuntos pequeños de números como este.

Esto se debe a que no existe una definición estándar de percentil. Tres formas comunes de definir el percentil 40 son:

  1. El número más pequeño que es mayor o igual al 40% de los números del conjunto (la definición que usamos en este ejemplo)
  2. El número más pequeño que es mayor que el 40% de los números del conjunto
  3. Si el número que calculamos en el Paso 5 no es un número entero, entonces usamos un número entre las dos posiciones enteras en cada lado, usando el proceso de interpolación .

La interpolación es un proceso matemático para obtener un número a una distancia específica entre otros dos números. Dado que el Paso 5 nos dio 4.4, querríamos encontrar cuánto se suma ese último 0.4 a la cuarta posición de 45. La matemática para hacer eso se ve así:

= cuarta posición + (decimal mayor que la cuarta posición) (diferencia entre la quinta y la cuarta posición)

= 45 + (0,4) (55 – 45)

= 45 + (0,4) (10)

= 45 + 4

= 49

El uso de estas diferentes definiciones arrojaría diferentes respuestas:

Definición utilizada Percentil 40 obtenido
1 45
2 55
3 49

La razón por la que no existe una definición estándar es porque para grandes conjuntos de datos, esencialmente no hay diferencia en la definición que se use. Piense en un ejemplo con 11.000 puntos de datos para este mismo tipo de encuesta. ¿Es probable que la diferencia entre la posición 4400 y 4401 sea una brecha de 10 en una encuesta de 100 puntos? ¿Qué crees que pasaría con un millón de conjuntos de datos?

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador