foto perfil

Fórmula de Distribución Bivariada y ejemplos

Publicado el 8 abril, 2024

Distribución bivariada

La distribución bivariada son métodos estadísticos utilizados para mostrar la probabilidad de que ocurran dos variables aleatorias. Uno de los métodos más comunes utilizados para mostrar esta información es con una tabla. Para tener una distribución normal bivariada o una distribución normal conjunta, ambas variables aleatorias deben tener una distribución normal y las variables deben ser independientes (los resultados de una variable no pueden afectar los resultados de la otra variable).

Un ejemplo de una distribución normal bivariada sería lanzar dos dados justos. El número que sale en un dado no depende de lo que sale en los otros dados. Ambos dados tendrán una probabilidad aleatoria de que aparezcan los números del 1 al 6. La distribución bivariada de este escenario mostraría la probabilidad de cada combinación.

 123456
11/361/361/361/361/361/36
21/361/361/361/361/361/36
31/361/361/361/361/361/36
41/361/361/361/361/361/36
51/361/361/361/361/361/36
61/361/361/361/361/361/36

En el caso de dos dados justos, la probabilidad de cada escenario es 1/36. Esto significa que la probabilidad de que ambos dados saquen uno es 1/36 y la probabilidad de que un dado saque dos y el otro cuatro también sea 1/36. Esta tabla también se puede utilizar para mostrar la distribución de probabilidad marginal o la probabilidad de los resultados de cada variable individual.

 123456Marginal
11/361/361/361/361/361/361/6
21/361/361/361/361/361/361/6
31/361/361/361/361/361/361/6
41/361/361/361/361/361/361/6
51/361/361/361/361/361/361/6
61/361/361/361/361/361/361/6
Marginal1/61/61/61/61/61/61

Importancia y usos de la distribución bivariada

La distribución bivariada es importante para determinar riesgos y probabilidades en muchas situaciones. Se usa con frecuencia en campos como seguros, atención médica y ventas. Estos pueden incluir aplicaciones tales como:

  1. Cálculo del riesgo de que una persona sufra un accidente automovilístico en función de su edad y la cantidad de citaciones de manejo recibidas.
  2. Determinar el riesgo de que alguien necesite una cirugía mayor según el IMC y los niveles de colesterol.
  3. Estimar cuánto tiempo un paciente ha tenido diabetes en base a la creatinina sérica y los niveles de glucosa en sangre en ayunas.
  4. Determinación del riesgo de infarto en función de los niveles de triglicéridos y de colesterol.
  5. Estimación del riesgo de accidentes en función del consumo de alcohol y la hora del día.
  6. Determinación de la probabilidad de vender un mouse cuando se vende un teclado.

Fórmula de distribución bivariada

En la tabla bivariada, las probabilidades se pueden calcular utilizando una fórmula de probabilidad. La probabilidad de cada posibilidad individual se encuentra dividiendo el número de veces que esa posibilidad puede ocurrir por el total de posibilidades. Se calcula individualmente para cada variable. En un dado justo, hay seis posibilidades y cada número tiene la capacidad de ocurrir una vez. Entonces, cada número tiene una probabilidad de ocurrir una vez en seis, o 1/6.

En la tabla bivariada, las posibilidades de cada variable se multiplican entre sí, para encontrar la probabilidad de que ambas ocurran:

 Variable 1
resultado 1
Variable1
resultado 2
Variable 1
resultado 3
Variable 2
resultado 1
p1.1*p2.1p1.2*p2.1p1.3*p2.1
Variable 2
resultado 2
p1.1*p2.2p1.2*p2.2p1.3*p2.2
Variable 2
resultado 3
p1.1*p2.3p1.2*p2.3p1.3*p2.3

En este caso, la probabilidad de que la variable 1 tenga el resultado 1 (1,1) y la variable 2 tenga el resultado 2 (2,1) es igual a la probabilidad de 1,1 veces la probabilidad de 2,1.

Para encontrar las distribuciones marginales se suman las probabilidades de cada fila y columna. Esto significa que la probabilidad marginal de que ocurra el resultado 1 de la variable 2, sin importar cuáles sean los resultados para la variable 1, es igual a {eq}(p1.1*p2.1)+(p1.2*p2.1)+( p2.3*p2.1) {/eq}.

 Variable 1
resultado 1
Variable1
resultado 2
Variable 1
resultado 3
Distribución marginal
Variable 2
resultado 1
p1.1*p2.1p1.2*p2.1p1.3*p2.1(p1.1*p2.1)+(p1.2*p2.1)+(p1.3*p2.1)
Variable 2
resultado 2
p1.1*p2.2p1.2*p2.2p1.3*p2.2(p1.1*p2.2)+(p1.2*p2.2)+(p1.3*p2.2)
Variable 2
resultado 3
p1.1*p2.3p1.2*p2.3p1.3*p2.3(p1.1*p2.3)+(p1.2*p2.3)+(p1.3*p2.3)
Distribución marginal(p1.1*p2.1)+(p1.1*p2.2)+(p1.1*p2.3)(p1.2*p2.1)+(p1.2*p2.2)+(p1.2*p2.3)(p1.3*p2.1)+(p1.3*p2.2)+(p1.3*p2.3)

Cada una de las distribuciones marginales debe sumar 1.

 Variable 1
resultado 1
Variable1
resultado 2
Variable 1
resultado 3
Distribución marginal
Variable 2
resultado 1
p1.1*p2.1p1.2*p2.1p1.3*p2.1(p1.1*p2.1)+(p1.2*p2.1)+(p1.3*p2.1)
Variable 2
resultado 2
p1.1*p2.2p1.2*p2.2p1.3*p2.2(p1.1*p2.2)+(p1.2*p2.2)+(p1.3*p2.2)
Variable 2
resultado 3
p1.1*p2.3p1.2*p2.3p1.3*p2.3(p1.1*p2.3)+(p1.2*p2.3)+(p1.3*p2.3)
Distribución marginal(p1.1*p2.1)+(p1.1*p2.2)+(p1.1*p2.3)(p1.2*p2.1)+(p1.2*p2.2)+(p1.2*p2.3)(p1.3*p2.1)+(p1.3*p2.2)+(p1.3*p2.3)1

Ejemplo de distribución bivariada

Hay dos tazones de mezcla de frutos secos, un tazón verde y un tazón rojo. En la mezcla de frutos secos, hay pasas, almendras, chispas de chocolate y trozos de granola. La proporción de ingredientes (pasas:almendras:chispas de chocolate:granola) es 2:2:1:3 en el tazón verde y 3:3:1:1 en el tazón rojo. Alguien selecciona al azar una pieza de cada tazón. En cada bol se calcula la probabilidad de seleccionar cada elemento:

  • Pasas de uva verdes: {eq}2/8=1/4 {/eq}
  • Almendras bowl verdes: {eq}2/8=1/4 {/eq}
  • Chips de chocolate bowl verde: {eq}1/8 {/eq}
  • Granola bol verde: {eq}3/8 {/eq}
  • Pasas de uva rojas: {eq}3/8 {/eq}
  • Almendras bowl rojas: {eq}3/8 {/eq}
  • Chips de chocolate de tazón rojo: {eq}1/8 {/eq}
  • Granola roja bowl: {eq}1/8 {/eq}

Estas probabilidades se combinan luego en una tabla. Primero, se enumeran las probabilidades de cada componente del recipiente verde:

 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
 1/41/41/83/8 
 1/41/41/83/8 
 1/41/41/83/8 
 1/41/41/83/8 
Marginal     

Luego, se insertan las probabilidades para cada componente del recipiente rojo:

 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
Cuenco rojo
Pasas
1/4*3/81/4*3/81/8*3/83/8*3/8 
Cuenco rojo
Almendras
1/4*3/81/4*3/81/8*3/83/8*3/8 
Cuenco rojo Chispas de
chocolate
1/4*1/81/4*1/81/8*1/83/8*1/8 
Cuenco rojo
Granola
1/4*1/81/4*1/81/8*1/83/8*1/8 
Marginal     

El producto de cada celda encontrada:

 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
Cuenco rojo
Pasas
3/323/323/649/64 
Cuenco rojo
Almendras
3/323/323/649/64 
Cuenco rojo Chispas de
chocolate
1/321/321/643/64 
Cuenco rojo
Granola
1/321/321/643/64 
Marginal     

La suma de cada fila y columna se calcula para encontrar la distribución marginal:

 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
Cuenco rojo
Pasas
3/323/323/649/6424/64
Cuenco rojo
Almendras
3/323/323/649/6424/64
Cuenco rojo Chispas de
chocolate
1/321/321/643/648/64
Cuenco rojo
Granola
1/321/321/643/648/64
Marginal8/328/328/6424/64 

Simplifica cada término:

 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
Cuenco rojo
Pasas
3/323/323/649/643/8
Cuenco rojo
Almendras
3/323/323/649/643/8
Cuenco rojo Chispas de
chocolate
1/321/321/643/641/8
Cuenco rojo
Granola
1/321/321/643/641/8
Marginal1/41/41/83/8 

Asegúrese de que la suma de ambas distribuciones marginales sea igual a 1:

  • {eq}3/8+3/8+1/8+1/8=8/8=1 {/eq}
  • {eq}1/4+1/4+1/8+3/8=2/8+2/8+1/8+3/8=8/8=1 {/eq}
 Cuenco verde
Pasas
Cuenco verde
Almendras
Cuenco verde Chispas de
chocolate
Cuenco verde
Granola
Marginal
Cuenco rojo
Pasas
3/323/323/649/643/8
Cuenco rojo
Almendras
3/323/323/649/643/8
Cuenco rojo Chispas de
chocolate
1/321/321/643/641/8
Cuenco rojo
Granola
1/321/321/643/641/8
Marginal1/41/41/83/81

Análisis de la distribución bivariada

El análisis de la distribución bivariada puede responder preguntas como:

  • ¿Cuál es la probabilidad de que alguien tome al azar una pasa del tazón verde y una chispa de chocolate del tazón rojo?
  • ¿Cuál es la probabilidad de que alguien tome al azar una chispa de chocolate del tazón rojo?
  • ¿Cuál es la probabilidad de que alguien tome al azar un trozo de granola y una almendra, sin importar de qué tazones se seleccione cada uno?

Para encontrar la probabilidad de que alguien tome una pasa del tazón verde y una chispa de chocolate del tazón rojo, encuentre la celda que corresponde a la pasa del tazón verde y la chispa de chocolate del tazón rojo. En este caso, esa probabilidad es uno de treinta y dos, o 1/32.

Para encontrar la probabilidad de que se seleccione una chispa de chocolate del tazón rojo (sin importar lo que se seleccione del tazón verde), observe la probabilidad marginal de la chispa de chocolate del tazón rojo, en este caso es uno de ocho, o 1 /8.

Para encontrar la probabilidad de que alguien seleccione al azar una pieza de granola y una almendra, encuentra las dos celdas que corresponden a la pieza de granola y la almendra, en este caso, 1/32 y 9/64. Luego suma las dos probabilidades: {eq}1/32+9/64=2/64+9/64=11/64 {/eq}.

Resumen de la lección

Una distribución bivariada es un método estadístico utilizado para examinar las probabilidades de que ocurran dos variables. Para que la distribución se distribuya normalmente, es necesario que haya 2 variables independientes. Las probabilidades se calculan multiplicando las probabilidades de cada resultado variable. La última fila y columna de la tabla se denomina distribución de probabilidad marginal . Se refiere a la probabilidad de que ocurra el resultado en esa fila de columna, sin importar el resultado de la otra variable. Se calcula tomando la suma de todas las probabilidades en esa fila o columna. La suma de todas las probabilidades debe sumar 1.

Para encontrar la probabilidad de que ocurra un conjunto de resultados, busque la celda en la tabla que corresponda a ambos resultados, y el número en esa celda corresponda a la probabilidad de ese conjunto de resultados. Es igual a la probabilidad de que ocurra cada resultado variable multiplicada por otra. Para encontrar la probabilidad de que ocurra un conjunto de resultados O que ocurra otro conjunto de resultados, sume las dos (o más) probabilidades.

Articulos relacionados