Distribuciones de probabilidad discretas: ecuaciones y ejemplos

Publicado el 23 noviembre, 2020

Ejemplo de venta de helado

Digamos que su buen amigo James acaba de comenzar un nuevo negocio vendiendo helados en un carrito de helados. Su carrito tiene una cantidad limitada de espacio, así que al principio, decidió comenzar cada día con 100 porciones de helado de vainilla, 100 porciones de helado de chocolate y 100 porciones de helado de fresa. Sin embargo, después de unas semanas, se da cuenta de que muchos días, se le acaba el helado de vainilla temprano y todavía le queda algo de fresa y chocolate. Tiene que irse a casa y rellenar su carrito de helados con vainilla mucho tiempo antes de que se le acaben los otros sabores. Él piensa que podría ganar más dinero y eliminar sus viajes adicionales para reabastecer el carrito de helados si pudiera calcular exactamente cuánto de cada tipo de helado almacenar cada día.

Para resolver su problema, James registra la cantidad total de helado de vainilla, chocolate y fresa que vendió cada día durante dos semanas. Cada caja de helado contiene 10 porciones, por lo que James registró la cantidad de porciones que vendió en grupos de 10, ya que no puede cargar solo una porción a la vez en su carrito. Los datos que recopiló se muestran en la siguiente tabla:

Datos de helado

Distribuciones de probabilidad discretas

James primero quiere estimar la cantidad de helado de vainilla que debería poner en su carrito cada mañana, por lo que examina un poco más de cerca los datos del helado de vainilla. Registra cuántas veces ocurrió cada cantidad durante las últimas dos semanas. Luego, calcula la probabilidad de que use una cierta cantidad en un día determinado. Por ejemplo, la probabilidad de que necesite 120 porciones es 1/14 o 0.071.

Datos de probabilidad de helado de vainilla

El número de porciones de helado que James debería poner en su carrito es un ejemplo de una variable aleatoria discreta porque solo hay ciertos valores que son posibles (120, 130, 140, etc.), por lo que esto representa una distribución de probabilidad discreta , ya que esto da la probabilidad de obtener cualquier valor particular de la variable discreta. Si suma todas las probabilidades, debería obtener exactamente una. Esto es cierto para todas las distribuciones de probabilidad discretas.

0.071 + 0.071 + 0.143 + 0.143+ 0.214 + 0.071 + 0.143 + 0.143 = 1.000

Función de valor esperado

¿Cómo puede esta información ayudar a James a determinar cuántas cajas de helado de vainilla debe cargar en su carrito cada día? Puede usar la función de valor esperado , que puede ver a continuación, para calcular cuántas cajas de helado puede esperar necesitar en un día promedio. Para usar la función de valor esperado, multiplique cada cantidad ( x i ) por la probabilidad de que use esa cantidad de helado en un día determinado ( p i ). Luego, sume todos estos valores.

función de valor esperado

Usando los datos de James, la función de valor esperado da lo siguiente:

E (x) = (120) (0.071) + (130) (0.071) + (140) (0.143) + (150) (0.214) + (160) (0.071) + (170) (0.143) + (180) (0,143) + (190) (0,143)

Esto se simplifica a lo siguiente:

E (x) = 8.57 + 9.29 + 20.00 + 34.29 + 21.43 + 12.14 + 25.71 + 27.14 = 158.57

El valor dado por la función de valor esperado también representa la media del conjunto de datos. Esto significa que, en promedio, James puede esperar necesitar alrededor de 159 porciones de helado de vainilla en su carrito cada día. Dado que cada caja contiene 10 porciones, puede esperar usar 16 cajas en un día promedio.

Varianza y desviación estándar

Ahora James sabe exactamente cuánto helado necesitará en un día normal, pero eso significa que en la mitad de los días, todavía se quedará sin helado. ¡No está de acuerdo con eso! Una cosa que podría ayudar a James es calcular la desviación estándar de sus datos. Si los datos se distribuyen aproximadamente normalmente, aproximadamente el 70% caerá dentro de una desviación estándar.

Para encontrar la desviación estándar, primero encuentre la varianza. La varianza es una forma de medir la dispersión en un conjunto de datos y se define como la suma de las desviaciones cuadradas de la media. Para una distribución de probabilidad discreta como esta, la varianza se puede calcular usando la siguiente ecuación:

varianza de una distribución de probabilidad discreta

Aquí es donde p i es la probabilidad de obtener cada valor y E (x) es el valor esperado (que es 158.57 en este caso).

El cálculo de la varianza de los datos de James proporciona la siguiente información:

Var ( X ) = (0.071) (120) 2 + (0.071) (130) 2 + (0.143) (140) 2 + (0.143) (150) 2 + (0.214) (160) 2 + (0.071) (170 ) 2 + (0,143) (180) 2 + (0,143) (190) 2 – 158,57 2

Por tanto, Var ( X ) = 440,8.

La desviación estándar es igual a la raíz cuadrada de la varianza, por lo que para estos datos la desviación estándar es:

ejemplo de desviación estándar

Para James, esto significa que casi el 70% del tiempo, necesitará entre 138 y 180 porciones de helado de vainilla al día. Utiliza esta información para decidir que cargará su carrito cada mañana con 18 cajas de helado de vainilla, que le proporcionarán 180 porciones. Sabe que ahora podrá ofrecer todo el helado de vainilla que sus clientes quieran la mayoría de los días.

Al igual que James, muchas personas y empresas utilizan distribuciones de probabilidad discretas para tomar decisiones importantes todos los días.

Resumen de la lección

Dediquemos un par de minutos a revisar lo que hemos aprendido acerca de las distribuciones de probabilidad discretas. Una variable discreta es una variable, como la cantidad de porciones de helado que vende James, para la cual solo son posibles ciertos valores. Una distribución de probabilidad discreta da la probabilidad de obtener cualquier valor particular de la variable discreta. La función de valor esperado para una variable discreta es una forma de calcular la media del conjunto de datos. Puedes ver la fórmula a continuación:

función de valor esperado

La varianza mide la extensión de los datos. Es igual a la suma de las desviaciones cuadradas de la media. Para una variable discreta, la varianza se puede calcular usando la siguiente fórmula que vimos anteriormente en la lección. Como puedes ver:

varianza de una distribución de probabilidad discreta

Finalmente, la desviación estándar es la raíz cuadrada de la varianza. Para datos distribuidos normalmente, alrededor del 70% estará dentro de una desviación estándar de la media.

5/5 - (1 vote)