Distribución normal y cambios en la media

Rodrigo Ricardo Publicado el 19 septiembre, 2020 5 minutos y 52 segundos de lectura

Distribución normal

Cuando las empresas usan gráficos para mostrar a las personas sus datos, tienen palabras para describir cómo se ve el gráfico y cómo se distribuyen los datos en el gráfico. En esta lección en video, hablamos sobre los tipos de gráficos que tienen una distribución normal donde los datos tienden hacia un valor medio con cantidades iguales a la izquierda y a la derecha.

Un gráfico con una distribución normal se parece al contorno de una campana, por lo que también se conoce como curva de campana. Puede ver que la mayoría de los datos están en el medio del gráfico donde la curva es la más alta. Hay menos datos a la izquierda y a la derecha del gráfico. También hay una cantidad igual de datos a la izquierda y a la derecha del gráfico.

Un gráfico de curva de campana
Ejemplo de gráfico de distribución normal

En el mundo real, hay una sorprendente cantidad de eventos que siguen una distribución normal. Por ejemplo, la altura de las personas sigue una distribución normal. Por eso podemos decir que, en general, la gente crecerá hasta cierta altura. Sin embargo, debido a la distribución normal, algunas personas serán más bajas y otras más altas, pero la mayoría de las personas tendrán la estatura promedio.

En los negocios, un gráfico que muestra la cantidad de clientes que vienen durante el día también puede mostrar una distribución normal. Por ejemplo, un restaurante que sirve almuerzos encontrará una distribución normal que muestra que la mayoría de sus clientes vienen a la hora del almuerzo, mientras que algunos vienen antes y después de la hora punta del almuerzo.

Caracteristicas

Debido a que hay la misma cantidad de datos a la izquierda y a la derecha, la media o el promedio de este gráfico es el medio del gráfico, el punto donde la curva es la más alta. Si dobla este gráfico por la mitad, los lados izquierdo y derecho se reflejarían entre sí y el gráfico se reduciría a cero a la izquierda y a la derecha. Un gráfico distribuido normalmente tiene la mitad de los datos a la izquierda y la otra mitad a la derecha. Hay un número igual de datos en ambos lados. Los datos no prefieren un lado sobre el otro.

También tenemos otro término que usamos al describir gráficos. Se llama desviación estándar. Es una medida de la dispersión de los datos. Para un gráfico con una distribución normal, el 34 por ciento de los datos está dentro de una desviación estándar desde el medio. Si tomamos 1 desviación estándar hacia la izquierda y hacia la derecha, tendremos el 68 por ciento de nuestros datos. Si tomamos 2 desviaciones estándar a la izquierda y a la derecha, tendremos el 95 por ciento de nuestros datos. Dentro de 3 desviaciones estándar, tendremos el 99,7 por ciento de nuestros datos. Estas desviaciones estándar dividen cada lado de nuestro gráfico en cuartos. El primer trimestre es el más cercano al medio, mientras que el cuarto trimestre cubre la parte final de cero.

Cambios a la izquierda y a la derecha

Cuando ve un gráfico en el que la punta de la curva se desplaza hacia la izquierda o hacia la derecha, ya no tenemos una distribución normal. Ahora tenemos un gráfico que muestra una preferencia por un lado u otro. Ahora nuestro promedio de los datos no será el centro exacto del gráfico. En cambio, nuestro promedio ahora se desplaza hacia la izquierda o hacia la derecha según la dirección en la que se desplace nuestra punta de la curva. Si la punta de nuestra curva se desplaza hacia la izquierda, también lo está nuestro promedio. Si la punta de nuestra curva se desplaza hacia la derecha, nuestro promedio también se desplaza hacia la derecha.

Con este tipo de gráficos, todavía vemos que los datos tienden a un valor particular. El valor particular simplemente no será el valor medio.

Aleatoriedad

Tampoco tenemos una distribución normal cuando nuestros datos se distribuyen aleatoriamente cuando no hay un patrón en los datos. No veremos una curva bonita como la que vemos con una distribución normal. En cambio, si trazáramos una línea que conectara nuestros datos, veríamos una montaña rusa realmente salvaje. Nuestros datos suben y bajan de forma aleatoria.

Con un grupo aleatorio, no veremos que los datos tiendan a ningún valor en particular. Con un gráfico aleatorio, no podremos decir que es probable que suceda este evento. Los datos no nos dan muchas pruebas de que algo suceda con más frecuencia que el resto. Por ejemplo, si las alturas de las personas fueran todas aleatorias, no podemos decir que las personas crecerán hasta una cierta altura porque podrían crecer hasta cualquier altura aleatoria.

Resumen de la lección

Repasemos lo que hemos aprendido ahora:

Una distribución normal es donde los datos tienden a un valor medio con cantidades iguales a la izquierda y a la derecha.

Nuestro gráfico con una distribución normal se puede dividir en cuartos a cada lado en función de las desviaciones estándar, la medida de la dispersión de los datos. Para una distribución normal, el 68 por ciento de nuestros datos cae dentro de la primera desviación estándar hacia la izquierda y la derecha; El 95 por ciento cae dentro de 2 desviaciones estándar hacia la izquierda y la derecha; y el 99,7 por ciento de los datos se encuentra dentro de 3 desviaciones estándar a la izquierda y la derecha del centro.

La media o promedio de los datos de un gráfico con una distribución normal es el centro exacto de los datos, la punta de la curva. Los lados izquierdo y derecho del gráfico también son imágenes especulares entre sí. Si la punta de la curva se desplaza hacia la izquierda o hacia la derecha, el promedio también se desplaza hacia la izquierda y la derecha, respectivamente. Sin embargo, cuando la punta de la curva se desplaza, ya no tenemos una distribución normal. Ahora tenemos un gráfico desplazado.

Además, un gráfico con datos aleatorios no tiene una distribución normal. Un gráfico aleatorio no nos muestra nada de lo que nos dicen los datos. Todo es aleatorio y no podemos hacer conjeturas basándonos en los datos.

Los resultados del aprendizaje

Una vez que haya terminado esta lección, debería poder:

  • Identificar y describir una gráfica de una distribución normal.
  • Definir las desviaciones estándar de una curva de campana
  • Discutir la apariencia de gráficos sin distribución normal

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador