Distribución beta: definición, ecuaciones y ejemplos

Rodrigo Ricardo Publicado el 23 noviembre, 2020 7 minutos y 28 segundos de lectura

Distribuciones de probabilidad

En estadística, a menudo se encontrará trabajando con distribuciones de probabilidad, que nos dan la distribución de todas las probabilidades posibles para un evento. Al tomar un curso de estadística, se encontrará trabajando con diferentes distribuciones de probabilidad. Cada una de estas distribuciones comunes tiene sus propios criterios específicos sobre cuándo es una distribución de probabilidad válida para un evento. En esta lección, aprenderemos qué es la distribución beta y cuándo se usa.

Definición de distribución beta

La distribución beta es una distribución de probabilidad continua que se puede utilizar para representar resultados proporcionales o de probabilidad. Por ejemplo, la distribución beta podría usarse para determinar la probabilidad de que su candidato preferido a la alcaldía reciba el 70% de los votos.

Para usar una distribución de probabilidad continua para encontrar probabilidades ( P ) se usa la siguiente fórmula general:

distribución de probabilidad continua

Esta fórmula encuentra la probabilidad de que la variable aleatoria X cae dentro del intervalo desde una a ayb dada la función de densidad f ( x ). Cada distribución de probabilidad continua tiene su propia función de densidad asociada, y la de la distribución beta es la siguiente:

función de densidad beta

En esta función de densidad hay algunas expresiones que no hemos visto antes. Los dos primeros, α y β , se conocen como parámetros de la distribución beta. La forma de la distribución beta en sí depende de estos dos parámetros y varía mucho según sus valores. La segunda es la función beta (Β), y está definida por las siguientes fórmulas que aparecen en su pantalla aquí:

función beta

La primera de estas fórmulas es la definición integral formal, pero es común trabajar con la segunda. La segunda fórmula utiliza la función gamma (Γ) y, a menudo, es más fácil trabajar con ella, ya que se puede representar mediante factoriales.

función gamma

La aproximación normal

Hay mucho que aprender con la función beta, y sin duda es importante para las estadísticas, pero hay ocasiones en las que podemos evitar el uso de la distribución beta. Si y solo si los parámetros α y β son aproximadamente iguales y significativamente grandes ( α , β ≥ 10), entonces la distribución beta puede aproximarse utilizando la distribución normal en un proceso llamado aproximación normal .

La distribución normal tiene la siguiente función de densidad de probabilidad, donde μ es la media y σ es la desviación estándar.

función de densidad de distribución normal

Lo bueno de la distribución normal es que podemos usar la tabla z para encontrar probabilidades en lugar de calcular integrales.

Al mirar esta imagen, verá la variable Z en la esquina superior izquierda. Esta Z es la variable aleatoria de la distribución normal estándar. En la columna más a la izquierda, verá los dígitos de las unidades y las décimas para el valor al que Z es menor, y en la fila superior verá los dígitos de las centésimas. El resto de los valores de la tabla z representan probabilidades. Cuando se le da un valor que Z es menor que, mira donde la columna más a la izquierda y la fila superior se cruzan para encontrar su probabilidad correspondiente. Por ejemplo, la probabilidad correspondiente a Z <-3,53 es 0,00021.

Usted lee una tabla z al hacer coincidir el punto de encuentro para la columna más a la izquierda y la fila superior para encontrar la probabilidad de que Z sea menor que -3.53.
ejemplo de tabla z

Para comprender completamente cómo usamos la tabla z para encontrar probabilidades, necesita comprender algo llamado notación de tabla z . La notación de tabla Z es una forma sencilla de representar si estamos buscando una probabilidad de que Z sea ​​menor que un valor, mayor que un valor o que esté dentro del rango de dos valores. Cómo escribimos esta notación se puede ver en la siguiente tabla:

Todos los cálculos deben realizarse en términos de Z menor que un número como se muestra en la tabla z.
notación de tabla z

Finalmente, también podemos usar la aproximación normal para calcular percentiles. Un percentil es el valor en el que un cierto porcentaje de un grupo cae por debajo de él. Por ejemplo, si una puntuación de 87 es la puntuación del percentil 85, significa que el 85% de todos los examinados obtuvieron un 87 o menos en la prueba.

En nuestro ejemplo anterior, nos dieron un valor Z y calculamos el porcentaje usando la tabla z . El cálculo de percentiles funciona al revés. Empiece con un porcentaje, encuentre el valor más cercano a él en la tabla z , y encuentre el valor Z a partir de eso. Una vez que tenga la Z valor, calcular los percentiles utilizando la siguiente fórmula resolviendo para X .

fórmula percentil

Ejemplos de distribución beta

Para consolidar todo lo que hemos aprendido en nuestras cabezas, trabajemos juntos en un par de problemas de ejemplo.

Ejemplo 1

Tanya ingresa a una rifa en la feria local y se pregunta cuáles son sus posibilidades de ganar. Si su probabilidad de ganar puede modelarse mediante una distribución beta con α = 5 y β = 2, ¿cuál es la probabilidad de que tenga como máximo un 10% de posibilidades de ganar?

Para resolver este problema, queremos usar la fórmula general para resolver probabilidades de una distribución de probabilidad continua.

distribución de probabilidad continua

Sabemos que f ( x ) es la función de densidad para la función beta, pero ¿qué pasa con los límites de integración, una y B ? La función beta se define en el intervalo de 0 a 1, por lo que los límites no pueden estar fuera de ese intervalo. En este caso, queremos saber si tiene como máximo un 10% de posibilidades de ganar. Esto significa que estamos buscando entre 0% y 10%, lo que nos da un límite inferior de integración de 0 y uno superior de 0,1.

Ahora tenemos todo lo que necesitamos para solucionar el problema. Comenzaremos resolviendo la función Beta usando la definición de la función Gamma y simplificando el interior de la integral tanto como sea posible.

problema1 parte1

Ahora terminamos el problema calculando la integral.

problema1 final

Ejemplo 2

Una fábrica se apaga durante unas horas debido a una falla en la máquina y el gerente quiere saber qué porcentaje de su producción diaria se perderá debido a eso. Si la proporción de producción perdida se puede describir mediante una función beta con α = 50 y β = 49, ¿cuál es la probabilidad de que pierdan entre el 15% y el 20% de la producción diaria?

En este caso, α y β son grandes y aproximadamente iguales, por lo que podemos usar una aproximación normal para resolver este problema. Queremos encontrar si el porcentaje de salida perdida está entre dos números, por lo que usando nuestro gráfico anterior, escribiríamos la notación de la tabla z de la siguiente manera:

configuración problem2

Con esto, solo usamos la tabla normal estándar para terminar el problema. Al leer la tabla, la probabilidad de que Z sea ​​menor que 0.2 es 0.57926 y la probabilidad de que Z sea ​​menor que 0.15 es 0.55962. Restando los dos obtenemos nuestra probabilidad.

problema2 final

Resumen de la lección

Muy bien, tomemos un momento para revisar lo que hemos aprendido. La distribución beta es una distribución de probabilidad continua para representar resultados de probabilidad y proporción. El método estándar para encontrar probabilidades ( P ) usando la función beta es usar la siguiente fórmula donde f ( x ) es la función de densidad de la distribución beta.

distribución de probabilidad continua

función de densidad beta

En la función de densidad de distribución beta, α y β son parámetros que determinan la forma de la distribución y Β es la función beta . La función beta se puede definir de dos maneras, pero usamos la definición de la función gamma cuando es posible.

funciones beta y gamma

Cuando α y β son significativamente grandes ( α , β ≥ 10) y aproximadamente iguales, podemos usar la aproximación normal para resolver problemas de distribución beta. Esto es útil porque usa la distribución normal, en la que podemos usar la tabla z en lugar de integrales para resolver problemas de probabilidad.

El z -table es una tabla de probabilidades para cuando la variable aleatoria Z es menor que algún número. Asegúrese de tener en cuenta la notación de la tabla z cuando trabaje con esta tabla. También podemos calcular percentiles con la tabla z . Un percentil nos dice el valor en el que un cierto porcentaje de un grupo cae por debajo de él. Para calcular los percentiles, usamos la tabla z para encontrar el valor Z más cercano al porcentaje dado y resolvemos para X en la siguiente fórmula, donde μ es la media y σ es la desviación estándar.

fórmula percentil

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador