Rodrigo Ricardo

Uso de la distribución normal: problemas de práctica

Publicado el 4 noviembre, 2020

Usando la distribución normal

Si ha estado trabajando con distribuciones normales durante mucho tiempo, probablemente haya descubierto que son cosas bastante útiles. Te ahorraré la pedante oportunidad de tirar un par de dados mil veces, sumando los resultados de cada tirada, para demostrar que es una forma confiable de gestionar grandes números. A estas alturas, también ha visto los beneficios de herramientas como la desviación estándar, que le muestran cuán compacto es el conjunto de datos en cuestión. Pero, ¿no sería útil poner en práctica todo ese conocimiento? ¿Qué pasaría si tuviera que calcular la probabilidad exacta de que algo suceda en una distribución normal y solo tuviera la desviación estándar? Afortunadamente, hay una forma de hacerlo.

Encontrar la puntuación Z

Primero, necesitamos calcular el Z-Score. El Z-Score es una medida de qué tan lejos está un punto de datos de la media en términos de desviaciones estándar. Si la desviación estándar de un conjunto de datos es 3, el promedio es 10 y el punto que estamos viendo tiene un valor de 13, entonces el puntaje Z es 1. La fórmula para eso es simple: tome el valor del punto en cuestión, reste la media y luego divídalo por la desviación estándar.

z = (punto de datos – media) / desviación estándar

A veces tendrás puntuaciones Z negativas. Eso es completamente comprensible. Mientras que una puntuación Z positiva significa que una puntuación Z representa un valor mayor que la media, una puntuación Z negativa solo significa que el valor representado es menor que la media. Por ejemplo, una puntuación Z de 1 representa un valor que es una desviación estándar mayor que la media y una puntuación Z de -1 representa un valor que es una desviación estándar menor que la media.

Con la puntuación Z puedes hacer algo. Ah, por cierto, las puntuaciones Z casi siempre se limitan a solo dos puntos decimales. Como verá, esto se debe a que los porcentajes resultantes son muy precisos.

Problemas unilaterales y bilaterales

Antes de profundizar demasiado en el uso de la distribución normal, primero asegurémonos de saber cómo funciona. El punto más alto de la curva es donde se ubica la media. A menudo se marca con un 0, ya que la puntuación Z de la media es 0.

Ahora pregúntese si va a tener que lidiar con una puntuación Z positiva o negativa. Una puntuación Z positiva se refiere a una desviación estándar que está a la derecha de la media, lo que significa que es mayor que la media. Por otro lado, una puntuación Z negativa se refiere a una desviación estándar que está a la izquierda de la media, lo que significa que es menor que la media.

Además, debe averiguar si se trata de una pregunta de un solo lado o de dos, así como en qué dirección van los datos. Las preguntas unilaterales solo se refieren a una puntuación Z. Mientras tanto, las preguntas de dos caras se refieren a dos puntuaciones Z, es decir, los datos entre ellos o fuera de ellos.

Averiguar en qué dirección van los datos es relativamente fácil. Si dice algo como mayor o más, está tratando de encontrar el área a la derecha de la puntuación Z, mientras que si dice algo como menor o menos, está tratando de encontrar el área a la izquierda de la Z -Puntuación. En esta lección, aprenderemos cómo hacer tanto mayor como menor que un determinado puntaje Z.

Llegado el momento, es hora de mirar los gráficos.

gráfico


Tabla de puntuaciones Z y áreas de curva normal estándar

sección transversal

Si fuera una puntuación Z negativa de -2,31, eso significaría que el 98,96% de los datos es mayor que 2,31 desviaciones estándar menos que la media. En cualquier caso, eso significa que el 1,04% de los datos no está representado por el conjunto. Para un puntaje Z positivo, eso significaría que 1.04% es mayor que 2.31 desviaciones estándar, mientras que para un puntaje Z negativo, 1.04% es menos de 2.31 desviaciones estándar.

Nuevamente, aquí es donde resulta útil conocer la diferencia entre un problema unilateral y uno bilateral. Si está resolviendo un problema unilateral, ¡ya ha terminado! Si no, tienes un paso más. Afortunadamente, es bastante fácil. Si está buscando el área entre dos puntuaciones Z, comience primero con la puntuación Z más grande. Encuentre el área para todos los datos que sea menor o que esté a la izquierda de esta puntuación Z más grande. Ahora, encuentre el valor de área para todos los datos que sea menor o que esté a la izquierda del valor de puntuación Z más pequeño. Reste esto del área de puntuación Z más grande para obtener el área intermedia. Si está buscando el área más allá de dos puntuaciones Z, simplemente reste ese porcentaje de 1.

Problema de ejemplo 1: demasiado corto para viajar

Eso es bastante para asimilar, así que asegurémonos de comprenderlo resolviendo algunos problemas de muestra.

Digamos que era un agente de seguros de parques temáticos y deseaba limitar el acceso a la montaña rusa más alta de su parque. No se permite montar a nadie de menos de 54 pulgadas. La altura promedio de sus visitantes es de 66 pulgadas y la desviación estándar es de 6 pulgadas. ¿Qué porcentaje de la población puede viajar?

Primero, busquemos la puntuación Z.

z = (54 – 66) / 6
z = -2

54 – 66 es -12, que luego se divide por nuestra desviación estándar, 6, para obtener la puntuación Z de -2.

Vamos a nuestra tabla para obtener un puntaje Z de -2.0 y encontramos que el número es .9772. Ahora pregúntese, ¿está buscando los números que son mayores o menores que esta puntuación Z? Obviamente, estamos buscando un mayor que, ya que nos preguntamos cuántas personas por encima de esa altura pueden montar. .9772 es mayor que 1 – .9772, por lo que estamos buscando todos los puntos posibles en el lado derecho de la curva. Como resultado, el 97,72% de la población podía montar.

Problema de muestra 2: Definición de una base de clientes

Eso solo incluía matemáticas en un lado de la distribución normal, así que probemos uno que lo involucre en ambos lados.

Imagine que trabaja para una empresa que está tratando de averiguar cuántos clientes potenciales tiene en una ciudad de 100.000 habitantes. El ingreso promedio es de $ 50,000 y la compañía sabe que las personas que ganan más de $ 100,000 no comprarán en su tienda, mientras que las personas que ganan menos de $ 25,000 no pueden comprar allí. La desviación estándar de los ingresos en esta ciudad es de $ 25 000.

Primero, calcule los dos puntajes Z.

bajo z = ($ 25,000 – $ 50,000) / 25,000
bajo z = -1

Para el extremo inferior, reste $ 50 000 de $ 25 000 y divida entre 25 000. Eso te da -1.

alto z = ($ 100,000 – $ 50,000) / 25,000
alto z = 2

Luego, para el extremo superior, reste $ 50,000 de $ 100,000 y divida por 25,000, dejando un puntaje Z de 2.

Ahora, buscamos el área entre las dos puntuaciones Z, que representa la cantidad de clientes potenciales para la empresa. Comencemos primero con la puntuación Z más grande de 2. Vaya al gráfico y verá que el valor de 2 es .9772. Esto significa que el 97,72% de la población se ubica a la izquierda de este puntaje Z.

Mire la puntuación Z más pequeña, -1. Encontramos que su valor en el gráfico es .8413, pero este es un puntaje Z negativo, así que recuerde que esto significa que el 84.13% de la población se ubica a la derecha. Para encontrar el área a la izquierda, simplemente réstelo de 1. Esto nos da 1 – .8413 = .1587, por lo que el 15.87% de la población cae a la izquierda de esta puntuación Z de -1.

Restamos este valor del valor de puntaje Z más grande, .9772 – .1587 = .8185, lo que nos da una respuesta de 81.85%. Eso significa que la tienda podría tener 81,850 clientes potenciales de una población de 100,000.

Resumen de la lección

En esta lección aprendimos cómo usar la distribución normal en la vida real para responder preguntas sobre grandes poblaciones. Los puntajes Z nos dan la capacidad de calcular la probabilidad de que algo suceda cuando solo se nos da la desviación estándar.

Recuerde que una puntuación Z es una medida de qué tan lejos está un punto de datos de la media en términos de desviaciones estándar. Puede utilizar un gráfico de puntuación Z para encontrar el valor de área asociado con cada puntuación Z en la distribución normal.

Una vez que tenga esas áreas de puntuación Z, puede usarlas para resolver todo tipo de problemas siempre que piense detenidamente en el área. Si está buscando datos que sean mayores que el valor representado por la puntuación Z, está tratando de encontrar el área a la derecha de la puntuación Z. Mientras que si dice algo como menor o menor, está tratando de encontrar el área a la izquierda del puntaje Z. Eso es todo lo que necesita hacer para los problemas unilaterales.

Los problemas de dos caras con dos puntuaciones Z requieren un paso más. Si está buscando el área entre las dos puntuaciones Z, busque todas las áreas para todos los datos que sean menores o que estén a la izquierda de la puntuación Z más grande. A continuación, busque el valor de área para todos los datos que sea menor o que esté a la izquierda del valor de puntuación Z más pequeño. Reste esto del área de puntuación Z más grande para obtener el área intermedia. Si está buscando el área más allá de dos puntuaciones Z, simplemente reste ese porcentaje de 1.

Términos clave

gráfico

desviación estándar: una cantidad calculada para indicar el grado de desviación de un grupo como un todo

Z-score: una medida de qué tan lejos está un punto de datos de la media en términos de desviaciones estándar

puntuación Z positiva: una puntuación Z que representa un valor mayor que la media

puntuación Z negativa: una puntuación Z que representa un valor menor que la media

Los resultados del aprendizaje

Entender esta lección significa que usted podría:

  • Cite una ventaja del uso de la desviación estándar.
  • Calcule la puntuación Z
  • Distinguir entre problemas de un solo lado y de dos lados
  • Identificar el propósito y la aplicación de una puntuación Z cuando solo se le da la desviación estándar

¡Puntúa este artículo!