Distribución normal de datos: ejemplos, definición y características

Publicado el 22 septiembre, 2020 por Rodrigo Ricardo

Datos y distribución

Imagina que eres un profesor que imparte un curso de introducción a la psicología. Al final del semestre, los 100 estudiantes completan un examen final que consta de 100 preguntas de opción múltiple. Los puntajes que recibieron sus estudiantes son los siguientes:

Al observar los datos, puede saber que la puntuación más alta que recibió un estudiante fue del 100% y la puntuación más baja fue del 60%. Lo que quizás no haya podido saber con solo echar un vistazo a la tabla es que los datos se distribuyen normalmente.

¿Qué es la distribución normal?

Una distribución normal es una curva de distribución de frecuencia en forma de campana. La mayoría de los valores de los datos en una distribución normal tienden a agruparse alrededor de la media. Cuanto más lejos esté un punto de datos de la media, es menos probable que ocurra. Hay muchas cosas, como la inteligencia, la altura y la presión arterial, que naturalmente siguen una distribución normal. Por ejemplo, si toma la altura de cien mujeres de 22 años y crea un histograma trazando la altura en el eje x, y la frecuencia a la que ocurre cada una de las alturas en el eje y, obtendrá un distribución normal.

Características de la distribución normal

Aquí vemos las cuatro características de una distribución normal. Las distribuciones normales son simétricas , unimodales y asintóticas , y la media , la mediana y la moda son todas iguales.

Una distribución normal es perfectamente simétrica alrededor de su centro. Es decir, el lado derecho del centro es una imagen especular del lado izquierdo. También hay un solo modo, o pico, en una distribución normal. Las distribuciones normales son continuas y tienen colas asintóticas, lo que significa que se acercan pero nunca tocan el eje x. El centro de una distribución normal se encuentra en su punto máximo, y el 50% de los datos se encuentra por encima de la media, mientras que el 50% está por debajo. De ello se deduce que la media, la mediana y la moda son todas iguales en una distribución normal.

Percentiles

Ahora, mire la línea que dice desviaciones estándar (SD) . Puede ver que el 34,13% de los datos se encuentran entre 0 SD y 1 SD. Dado que una distribución normal es perfectamente simétrica, se deduce que el 34,13% de los datos se encuentra entre -1 DE y 0 DE. Si continúa sumando los porcentajes, verá que en ambos lados:

  • Aproximadamente el 68% de los datos se encuentran dentro de 1 DE de la media
  • Aproximadamente el 95% de los datos se encuentran dentro de 2 DE de la media
  • Aproximadamente el 99,7% de los datos se encuentran dentro de las 3 DE de la media

Esto se conoce como regla empírica .

¿Puede ubicar la media en el gráfico usando la línea de porcentaje acumulativo? La media está en la marca del 50%. Esto indica que el 50% de los datos se encuentra por debajo de la media. La línea de ‘porcentaje acumulado’ se refiere al porcentaje de datos que se encuentra a la izquierda del valor.

Ejemplo

Veamos un histograma usando las calificaciones del examen final de los 100 estudiantes. Es perfectamente simétrico en el centro. La mitad de los estudiantes puntuó por debajo del 80% y la otra mitad por encima, por lo que el 80% es la mediana. No es coincidencia que el 80% sea el puntaje más alto; 20 estudiantes de 100 obtuvieron 80%.

Si observa el histograma, también verá que la puntuación media es del 80%. Por lo tanto, la media, la mediana y la moda son todas iguales. Solo hay un pico en el gráfico, por lo que los datos son unimodales. También podemos ver que los extremos finales de los gráficos se acercan mucho a cero, pero nunca lo alcanzan.

Una desviación estándar es igual a 10 y la media es 80%. Usando la regla empírica, podemos suponer que:

  • Aproximadamente el 68% de los datos se encuentran entre el 70% y el 90%
  • Aproximadamente el 95% de los datos se encuentran entre el 60% y el 100%
  • Aproximadamente el 99,7% de los datos se encuentran entre el 50% y el 100%. Sabemos que no puede obtener una puntuación superior al 100% en un examen, de lo contrario sería 110%

Resumen de la lección

La distribución normal es una distribución de frecuencia en forma de campana. Las distribuciones normales son simétricas, unimodales y asintóticas, y la media, la mediana y la moda son todas iguales. Las distribuciones normales también siguen la regla empírica. Esto significa que aproximadamente el 68% de los datos se encuentran dentro de 1 DE de la media, el 95% de los datos se encuentran dentro de 2 DE de la media y el 99,7% de los datos se encuentran dentro de 3 DE de la media.

Los resultados del aprendizaje

Una vez que haya terminado, debería poder:

  • Recuerde qué es la distribución normal de datos
  • Enumere las características de la distribución normal
  • Explica qué significa la regla empírica.

Articulos relacionados