Desarrollar distribuciones de probabilidad discretas empíricamente y encontrar valores esperados

Publicado el 4 noviembre, 2020

Cambio de datos en probabilidad

Imagínese si le dieran un conjunto de números que representan la cantidad de teléfonos celulares en diferentes hogares.

num celda

¿Cómo interpretaría estos números? Para comprender los datos, a menudo es necesario tabularlos. A medida que se recopilan los datos, también se debe decidir si los datos son discretos o continuos, ya que esto afectará la forma en que se tabulan los datos. Tomemos un ejemplo de un conjunto de datos discretos.

Suponga que un equipo de investigación recopila algunos datos sobre la cantidad de teléfonos celulares en los hogares de la ciudad ficticia de Phonyville. El primer paso sería decidir qué representa la variable aleatoria. Dado que estamos analizando el número de teléfonos móviles, es natural que X , la variable aleatoria, sea el número de teléfonos móviles por hogar.

También tenga en cuenta que X es discreta porque representa números distintos, ¡ya que no se puede tener realmente una fracción de un teléfono celular! Por tanto, X podría oscilar entre 0 y un número muy grande. Sin embargo, supongamos que el porcentaje de hogares que tienen 5 o más teléfonos móviles es insignificante. Si tabulamos los resultados, podría verse así:

X = Número de teléfonos móvilesNúmero de hogares
0457
118,763
222,345
312,534
49,830
5 o más11
Número total de encuestados: 63,940

Si miramos la tabla, vemos que había 457 hogares sin teléfonos celulares, 18,763 hogares con 1 teléfono celular, 22,345 hogares con 2 teléfonos celulares y así sucesivamente. Además, 5 o más se agrupan como una categoría, ya que en relación con el tamaño de la muestra, la cantidad de hogares con 5 o más teléfonos celulares era muy pequeña. También observe que se encuestó a un total de 63,940 hogares para recopilar estos datos.

Entonces, tenemos un recuento del número de hogares con la diferente cantidad de teléfonos celulares, pero necesitamos convertir estos números a un porcentaje o probabilidad. Bueno, hacemos esto dividiendo cada recuento del número de hogares por el número total de hogares para crear un decimal o proporción para cada categoría. El decimal también es una probabilidad empírica.

X = Número de teléfonos móvilesNúmero de hogaresP ( X )
04570,007147
118,7630.293447
222,3450.349468
312,5340.196028
49,8300.153738
5 o más110,000172
Total encuestados: 63,940Total de P ( X ): 1

Mirando la tabla, vemos que la probabilidad de un hogar sin teléfonos celulares (o probabilidad de que X = 0) es 457 dividido por 63,940, que es 0.007147. La probabilidad de seleccionar un hogar con solo un teléfono celular (o probabilidad de que X = 1) es 18,763 dividido por 63,940, que es 0.293447, o aproximadamente 29%, y así sucesivamente. Si lo desea, puede pausar el video para tomar un minuto aquí y calcular el resto de las probabilidades en la tabla para asegurarse de que sus resultados coincidan con los de la tabla.

Debería haber calculado las mismas probabilidades que la tabla y tenga en cuenta que la probabilidad para 5 o más teléfonos móviles es muy pequeña a 0,00017, que es la razón por la que 5 o más teléfonos móviles se agruparon en una categoría. También tenga en cuenta que todas las probabilidades suman un total de 1, o 100%, que es propiedad de una distribución de probabilidad.

Entonces, vemos que las probabilidades empíricas son probabilidades generadas a partir de datos y lo que calculamos fue la distribución de probabilidad para X , ¡la cantidad de teléfonos celulares en los hogares de la ciudad de Phonyville!

Valor esperado de la distribución

¿Qué pasa si llamamos al azar a una casa en Phonyville? ¿Cuántos teléfonos móviles esperaríamos que tuvieran los residentes?

Para calcular el valor esperado, usamos la fórmula: valor esperado de X = Suma de ( X veces P ( X ))

Esperado

Para facilitar el cálculo, redondearé las probabilidades anteriores a tres decimales. La mayoría de las veces, esto no afectará los resultados de manera significativa, pero en caso de duda, mantenga sus probabilidades con 5 a 6 lugares decimales en sus cálculos hasta el final. Entonces, esperamos (0 x .007) + (1 x .293) + (2 x .349) + (3 x .196) + (4 x .154) + (5 x .000) = 2.196 teléfonos celulares en un hogar seleccionado al azar.

X = Número de teléfonos móvilesNúmero de hogaresP ( X )X por P ( X )
04570,0071470.000
118,7630.2934470,293
222,3450.3494680,699
312,5340.1960280.588
49,8300.1537380,615
5 o más110,0001720,001
Valor esperado =Suma de ( X por P ( X )) = 2.196

Por tanto, el valor esperado de la distribución es 2,196, o aproximadamente 2,2. Sin embargo, en realidad no se puede tener un teléfono celular parcial, y algunos hogares tendrían más y otros menos de 2.2, pero esta es la cantidad de teléfonos celulares por hogar que esperaríamos en promedio. De hecho, otro nombre para el valor esperado es la media de la distribución.

Tomemos otro ejemplo.

Seguro

¿Cómo saben las compañías de seguros cuánto cobrarle por una póliza? ¿Cómo saben que justo después de obtener una póliza de seguro para un automóvil, no va a chocar y presentar un reclamo al día siguiente o en un futuro cercano? O, si contrata esa póliza de seguro de vida de un millón de dólares, ¿cómo saben (las compañías de seguros) que no morirá la próxima semana? ¡Es un gran riesgo para ellos! ¿O es eso?

Las compañías de seguros se basan en la ley de los promedios para obtener ganancias. Distribuyen el riesgo de catástrofe entre todos los asegurados. Algunas personas harán un reclamo, pero la mayoría no lo hará. ¿Cómo saben esto? Recopilan minuciosamente datos de la población sobre muchos, muchos rasgos de personas de raza, edad, sexo, demografía, etc. Luego, compilan los datos en las probabilidades y finalmente generan los valores esperados para cada situación. El proceso de hacer esta compilación de datos y análisis de probabilidades se llama ciencia actuarial y es un campo muy bien pagado si puede pasar las pruebas para convertirse en actuario. Entonces, estudia en …

Echaremos un vistazo a un ejemplo sencillo.

A partir de las tablas de mortalidad, Mutual Insurance Co. ha determinado que la probabilidad de que una mujer de 20 años muera en un año es de 0,0025. Quieren vender una póliza de seguro de vida de $ 100,000 a 1 año a una mujer de 20 años. ¿Qué deben cobrar por la póliza si desean ganar $ 40 en la póliza?

Para resolver esto, necesitamos encontrar el valor esperado para la compañía de: una póliza de $ 100,000 con un plazo de 1 año vendida a una mujer de 20 años.

Recuerde, para calcular el valor esperado, necesitamos dividir la situación en eventos. Cada evento tendrá un valor X y una probabilidad correspondiente. Solo hay dos eventos en esta situación: la persona vive o la persona muere. La probabilidad de que la mujer de 20 años muera es 0,0025, como se indicó anteriormente. ¿Cuál es la probabilidad de que viva? Bueno, este es el complemento de morir, por lo que su probabilidad es 1 – 0.0025 = 0.9975.

¿Qué valor tiene cada evento para la empresa?

Bueno, si la mujer de 20 años muere, la empresa tiene que pagar $ 100.000, por lo que esto tiene un valor negativo de $ 100.000 para la empresa. En otras palabras, ¡pierden $ 100,000! Sin embargo, si vive, la empresa no pierde nada, y en este momento valdría 0 dólares para la empresa hasta que agreguemos una prima a la póliza.

Entonces, para calcular el valor esperado, multiplicamos las probabilidades por los valores y luego sumamos los resultados. Entonces, el valor esperado para la empresa es (0.0025 x -100,000) + (0.9975 x 0), lo que equivale a -250.

Inspeccionar esperar

Esto significa que, en promedio, por póliza de este tipo, la empresa perderá 250 dólares por póliza. Entonces, para cubrir sus pérdidas en esta póliza por el reclamo ocasional de $ 100,000, lo distribuirán entre los asegurados para que les cueste (a los asegurados) $ 250 cada uno. Sin embargo, ¡la empresa quiere obtener beneficios! Específicamente, quiere ganar $ 40 por póliza de este tipo. Por lo tanto, debe cobrar $ 250 por póliza para cubrir la pérdida más $ 40 por ganancias. Esto equivale a $ 290 para la póliza de 1 año. ¡Y a este precio casi se garantiza que ganarán $ 40 por póliza de este tipo!

Aquí hay otra forma de pensar en esto: la probabilidad de que una mujer de 20 años muera es 0.0025, lo que equivale a 1/400. Esto significa que por cada 399 mujeres de 20 años que viven, una morirá. Entonces, dividiendo el reclamo de $ 100,000 por 400 = $ 250 cada uno por asegurado. ¡Cualquier cosa extra es una ganancia para la empresa!

Gráfico Ins

Resumen de la lección

En esta lección, vimos que para probabilidades empíricas (como el número de teléfonos celulares, las tasas de mortalidad, tasas de accidentes, las compañías de seguros, etc.), podemos recopilar los datos de las muestras o poblaciones para generar una distribución de probabilidad de la variable aleatoria X . La variable aleatoria X adquiere diferentes valores según la situación. Y, la probabilidad de cada valor de X se calcula tomando la frecuencia de cada valor de X dividida por el número total de la muestra.

Además, a partir de distribuciones de probabilidad, podemos calcular el valor esperado de la distribución. Para calcular el valor esperado, multiplique cada valor de X por su probabilidad y sume los resultados. El valor esperado también se conoce como la media o el promedio de la distribución de probabilidad. Los valores esperados se utilizan en situaciones de la vida real y conocer el valor esperado o cómo calcularlo permite tomar decisiones personales y comerciales informadas.

Los resultados del aprendizaje

Después de esta lección, podrá:

  • Explica cómo generar una distribución de probabilidad.
  • Recuerde cómo calcular el valor esperado de una distribución de probabilidad
  • Describir una situación de la vida real en la que sea útil utilizar el valor esperado.

¡Puntúa este artículo!