Función de densidad de probabilidad: definición, fórmula y ejemplos

Publicado el 22 noviembre, 2020

Antecedentes de los modelos de probabilidad

Los modelos de probabilidad, que cuantifican las posibilidades de que ocurra un evento aleatorio, son comunes en la vida cotidiana. Tomemos, por ejemplo, el lanzamiento de una moneda justa. Creemos que si se lanza una moneda justa, tiene las mismas posibilidades de caer en cara o cruz. Lo que esto significa en la práctica es que si lanzamos la moneda una gran cantidad de veces, la mitad de las veces la moneda mostrará cara y la otra mitad mostrará cruz. Por lo tanto, asignamos probabilidad ½ a las caras del resultado y ½ a las colas del resultado. Este es un ejemplo de modelo de probabilidad .

Sin embargo, la asignación de probabilidades a ciertos eventos no siempre funciona. Un ejemplo es un juego de dardos. ¿Cuál es la diferencia entre lanzar monedas y dardos? En particular, un juego de dardos es una situación en la que el resultado (la posición final del dardo) puede adquirir un rango continuo de valores.

Más específicamente, suponga que está lanzando dardos a un tablero de dardos y desea determinar la probabilidad de golpear un punto que está exactamente en el eje vertical, dos pulgadas por encima del centro. Como en el ejemplo del lanzamiento de una moneda que repasamos al principio, la probabilidad que le asignaríamos a este resultado es la fracción de dardos que golpean este punto preciso después de lanzar una gran cantidad de dardos.

Sin embargo, es poco probable que algún dardo alcance ese punto exacto, por lo que incluso en el límite de un número infinito de lanzamientos, la probabilidad de acertar en un solo punto es extremadamente pequeña. Aunque este problema parece complicar la construcción de un modelo de probabilidad, no es consecuencia del juego de dardos en la práctica porque la determinación de la puntuación depende de encontrar el dardo dentro de ciertas regiones finitas del tablero. Entonces, ¿cómo podemos relacionar la probabilidad casi nula de acertar en cualquier punto en particular con la probabilidad de que un dardo alcance una determinada región de puntuación del tablero? Una función de densidad de probabilidad aborda este problema.

Funciones de densidad de probabilidad

Para hacer un modelo de probabilidad para un escenario donde los resultados de eventos aleatorios se valoran numéricamente en un rango continuo, como en el ejemplo de la diana, se debe dar una función de densidad de probabilidad f (x) . Esta función proporciona una forma de asignar probabilidades no a resultados individuales, sino a rangos de resultados, como regiones de puntuación de un tablero de dardos. Los científicos e ingenieros a menudo hacen una suposición fundamentada sobre la forma exacta de esta función. La variable independiente x de esto, la función de densidad de probabilidad, toma valores dentro del rango continuo de posibles resultados de un proceso aleatorio. En consecuencia, x se denomina variable aleatoria continua. La ubicación de un dardo lanzado a un tablero de dardos es una variable aleatoria continua porque entre dos ubicaciones posibles, puede encontrar otro resultado posible.

Si tuviéramos una función de densidad de probabilidad f (x) para dardos que golpean un tablero de dardos, o cualquier otro proceso aleatorio que involucre una variable aleatoria continua, ¿cómo calcularíamos una probabilidad para un evento, como dar en la diana en un tablero de dardos? Según la teoría de la probabilidad, la probabilidad de medir un resultado dentro de un rango finito se puede calcular integrando la función de densidad de probabilidad en el intervalo de interés:

probabilidad

Pr [A≤ x ≤B] representa la probabilidad de un resultado dentro del intervalo desde A a B . Por ejemplo, el tamaño del pie en centímetros es una variable aleatoria continua. Si desea saber la probabilidad de elegir a alguien con una longitud de pie entre 21 y 22 centímetros de una muestra aleatoria, y cree que la función de densidad de probabilidad que describe la distribución de longitudes de pie en centímetros es f (x) , entonces integra f (x) desde x = 21 cm hasta x = 22 cm.

Propiedades generales importantes

Esta receta para obtener probabilidades a partir de funciones de densidad implica dos propiedades importantes que una función de densidad de probabilidad debe tener para modelar un resultado real de un proceso aleatorio. Primero, una función de densidad de probabilidad debe ser no negativa (es decir, f (x)> 0 para todos los valores x ). En segundo lugar, una función de densidad de probabilidad que debe obedecer una regla se denomina condición de normalización. La condición de normalización dice:

normalización

El rango de integración ‘todo x’ significa sobre todos los resultados posibles (incluso los resultados más improbables) de la medición. En el ejemplo del tablero de dardos, ‘todo x’ significaría sobre todo el tablero, la pared cercana y el piso, ya que algunos lanzadores de dardos sin experiencia pierden el tablero por completo. Traducido al lenguaje cotidiano, la condición de normalización significa que esperamos que todos los resultados posibles se encuentren en algún lugar dentro del rango de valores posibles, aunque poco probables.

Algunos ejemplos

Cuando se utilizan funciones de densidad de probabilidad para describir escenarios del mundo real, los científicos a menudo tienen que hacer conjeturas fundamentadas sobre la forma matemática de la función de densidad de probabilidad. En esta sección, presentamos las dos funciones de densidad de probabilidad más comunes.

El primero es la densidad de probabilidad uniforme . Es una función constante: f (x) = C donde C es una constante. Esta densidad de probabilidad significa que todos los resultados posibles son igualmente probables dentro del rango de resultados posibles. ¿Cuándo podría ser una buena suposición? Si volvemos a considerar los dardos, alguien que nunca haya jugado a los dardos antes y que haya estado con los ojos vendados en una posición frente al tablero produciría una distribución de dardos que probablemente sea uniforme sobre el tablero de dardos, la pared y el piso cercano. Todos los puntos de la pared, el suelo y el tablero tienen la misma probabilidad de ser golpeados por jugadores de dardos sin experiencia.

En la práctica, ¿cómo sabemos a qué es igual la constante? Aquí es donde la condición de normalización es útil: la constante es igual a lo que produce una función de densidad de probabilidad normalizada. Específicamente, si el rango de posibles resultados es de x = X 1 a x = X 2 , entonces la función de densidad de probabilidad uniforme es

pdf uniforme

porque la integración de esta constante en el rango de X 1 a X 2 es igual a 1.

Otra función de densidad de probabilidad es la densidad de probabilidad normal , a veces llamada distribución normal . Esta densidad de probabilidad es útil cuando los resultados aleatorios se agrupan alrededor de un punto central. Utilizando el ejemplo de los dardos nuevamente, alguien que tenga experiencia jugando a los dardos produce una distribución de dardos descrita por una densidad normal, centrada en la diana.

Resumen de la lección

Las funciones de densidad de probabilidad se utilizan para describir escenarios en los que un resultado aleatorio puede asumir un rango continuo de valores, y este rango continuo de resultados hace que siempre haya una probabilidad cero de que sea posible predecir un resultado exacto. La integración de una función de densidad de probabilidad permite calcular la probabilidad de medir un valor dentro de un intervalo dado de posibles resultados.

Discutimos dos propiedades de las funciones de densidad de probabilidad: la no negatividad y la condición de normalización , lo que significa que esperamos que todos los resultados posibles se encuentren en algún lugar dentro del rango de valores posibles, aunque poco probables. Dos funciones de densidad de probabilidad comunes son la densidad de probabilidad uniforme , lo que significa que todos los resultados posibles son igualmente probables dentro del rango de resultados posibles (como entre 0 y 1), y la densidad de probabilidad normal , también conocida como distribución normal, y es útil cuando los resultados aleatorios se agrupan en torno a un punto central.

¡Puntúa este artículo!