Distribuciones de probabilidad
Sally tiene una amiga, Sarah, que cree que es más probable que estudiantes de un género elijan ciertas carreras universitarias que de otro. Sally no está de acuerdo con la afirmación de Sarah, por lo que decidió encuestar a los estudiantes en su campus universitario. Una vez que recopiló los datos, utilizó una distribución de chi cuadrado para determinar si su predicción era correcta.
La distribución de chi cuadrado es un tipo de distribución de probabilidad acumulativa. Las distribuciones de probabilidad proporcionan la probabilidad de cada valor posible que pueda ocurrir. Las distribuciones que son acumulativas dan la probabilidad de que una variable aleatoria sea menor o igual a un valor particular. Dado que la suma de las probabilidades de cada valor posible debe ser igual a uno, el área total bajo la curva es igual a uno.
Para encontrar la probabilidad de un valor particular, encontramos el área debajo de la curva antes del valor. El área que está después del valor se denomina valor p , que es importante para las pruebas estadísticas que usan chi cuadrado. En esta figura, X ^ 2 representa chi cuadrado y p representa el valor p :
![]() |
¿Qué es la distribución de probabilidad discreta? Ecuaciones y ejemplos
Las distribuciones de chi cuadrado varían según los grados de libertad. El grado de libertad se encuentra restando uno del número de categorías en los datos. Por ejemplo, si reúne datos sobre el sexo de los estudiantes matriculados en programas de ciencia, arte y educación, tiene tres categorías de estudiantes: una para cada programa. Mi grado de libertad sería 2 (o 3 – 1). En este gráfico, cada curva representa la distribución de chi cuadrado para un grado de libertad diferente:
![]() |
No importa cuántos grados de libertad haya, la forma de una distribución de chi cuadrado siempre está sesgada a la derecha. Sin embargo, a medida que aumenta el grado de libertad, la forma se acerca a una distribución normal con una forma de campana simétrica.
Muchos análisis estadísticos implican el uso del valor p . Sin embargo, calcular una parte del área bajo la curva puede resultar complicado. Este gráfico se puede utilizar para encontrar valores p para varios grados de libertad. Por ejemplo, si el valor de chi cuadrado es 5 para un conjunto de datos que tiene un grado de libertad igual a 4, podemos seguir la curva para ver que el valor p es aproximadamente 0.3:
Distribución de Probabilidad: Fórmula y ejemplos
![]() |
Suele ser más eficaz utilizar una tabla de chi cuadrado. En esta tabla, cada fila representa un grado de libertad diferente junto con varios valores de chi cuadrado. Los valores p correspondientes se enumeran en la parte superior de cada columna:
![]() |
Distribución Uniforme: Definición, gráfico y ejemplos
Encontrar Chi cuadrado
Chi cuadrado es un cálculo utilizado para determinar qué tan cerca se ajustan los datos observados a los datos esperados. En la siguiente fórmula chi cálculo cuadrado, X representa chi, mientras que O y e representan los valores observados y esperados, respectivamente:
![]() |
Veamos un ejemplo para ver cómo se puede usar chi cuadrado para una prueba de independencia. En este ejemplo, queremos usar los datos para determinar si la elección del programa de los estudiantes universitarios depende del género. Primero, necesitamos establecer una hipótesis nula, prediciendo que el programa de matrícula de los estudiantes es independiente de su género. Los resultados de nuestra prueba de chi cuadrado determinarán si debemos aceptar o refutar la hipótesis nula. Los estadísticos normalmente aceptan la hipótesis nula si el valor p es 0.05 o más. Aquí están los datos:
| Ciencias | Arte | Educación | |
|---|---|---|---|
| Hembra | e : 69, o : 56 | e : 40, o : 43 | e : 62, o : 74 |
| Masculino | e : 69, o : 82 | e : 40, o : 37 | e : 62, o : 50 |
Observe que hay dos valores en cada celda de la tabla: uno para el valor esperado ( e ) y otro para el valor observado ( o ). Los valores esperados se basan en nuestra hipótesis nula de que la elección del programa no depende del género, por lo que debería haber un número igual de cada género en los programas. Los valores observados son de datos recopilados. Ahora podemos usar nuestros valores esperados y observados para calcular chi cuadrado, así:
![]() |
Dado que hay tres categorías (ciencia, arte y educación), el grado de libertad es 2. Siguiendo la fila para un grado de libertad de 2 en la tabla de chi cuadrado, buscamos los valores más cercanos a nuestro valor de chi cuadrado de 10. 10 cae entre 9.21 y 10.597, por lo que nuestro valor p cae entre los valores p correspondientes de 0.01 y 0.005. Dado que esto cae por debajo del valor p de 0.05, rechazaríamos la hipótesis nula. Esto nos dice que según nuestros datos, el programa de elección depende del género. ¡Sarah tenía razón!
Resumen de la lección
Las distribuciones de chi cuadrado se utilizan para identificar la probabilidad de que ocurra un valor. El valor de probabilidad se puede utilizar para determinar qué tan cerca se ajustan los valores observados a los valores esperados y si las variables son independientes entre sí. Una vez que se calcula el valor de chi cuadrado a partir de la ecuación de chi cuadrado, se puede utilizar la tabla o el gráfico de la distribución de chi cuadrado para determinar el valor p . Si el valor p es mayor que 0.05 para una prueba de independencia, las variables son independientes entre sí.
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...






