Probabilidad empírica: definición, fórmula y ejemplos

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

¿Alguna vez has notado que un jugador de baloncesto encesta más tiros libres en casa que fuera? ¿O que tu aplicación de mapas predice el tiempo de llegada con una precisión asombrosa? Detrás de esas observaciones cotidianas está la probabilidad empírica, un concepto clave para entender el mundo real basado en datos, no en suposiciones teóricas.

A diferencia de la probabilidad clásica (esa que dice «al lanzar una moneda hay un 50% de que salga cara»), la probabilidad empírica se construye desde la experiencia: experimentos reales, frecuencias observadas y evidencia tangible. Si quieres tomar mejores decisiones, analizar tendencias o simplemente aprobar tu próximo examen de estadística, este concepto es tu mejor aliado.

En este artículo no solo aprenderás su definición exacta y su fórmula, sino que verás ejemplos paso a paso, diferencias clave con otros tipos de probabilidad y cómo aplicarla en disciplinas como el marketing, la medicina o la ingeniería.

¿Qué es la probabilidad empírica? Definición clara y directa

La probabilidad empírica (también llamada probabilidad frecuentista o probabilidad experimental) es una medida que se obtiene al realizar un experimento muchas veces y registrar los resultados. Se calcula como: $P (E) = \frac{N \overset{ˊ}{u} mero de veces que ocurre el evento E}{N \overset{ˊ}{u} mero total de pruebas realizadas}$

Esta definición tiene tres características fundamentales:

Tema relacionado:
Cómo enseñar Fracciones en Primaria: Guía educativa para docentes

Se basa en la observación directa – No hay fórmulas mágicas ni supuestos de simetría (como en una moneda perfecta). Simplemente repites el experimento y cuentas.
Requiere experimentos repetibles – Para que tenga sentido, debes poder realizar la misma prueba muchas veces bajo condiciones similares.
Converge a la probabilidad teórica – Según la Ley de los Grandes Números, si repites el experimento muchas veces, la probabilidad empírica se acerca a la probabilidad real o teórica.

Un ejemplo clásico: si lanzas un dado 100 veces y el número 3 sale 22 veces, la probabilidad empírica de obtener un 3 es 22/100 = 0,22. La teórica sería 1/6 ≈ 0,1667. La diferencia se debe al azar, pero si lanzas 10.000 veces, la empírica se acercará mucho a 0,1667.

Diferencia con probabilidad teórica y subjetiva

Probabilidad teórica (clásica): se calcula sin experimentos, asumiendo resultados igualmente probables (ej: carta de una baraja).
Probabilidad subjetiva: basada en la creencia o experiencia personal (ej: «creo que mañana lloverá un 80%»).
Probabilidad empírica: basada en datos históricos o experimentos reales.

Para la ciencia, los negocios y la ingeniería, la probabilidad empírica es la reina porque se apoya en hechos, no en opiniones.

Fórmula de la probabilidad empírica: desglose paso a paso

La fórmula ya la vimos, pero merece una explicación más detallada para que no haya confusiones: $P_{emp} (A) = \frac{f_{A}}{n}$

Donde:

$P_{emp} (A)$ = probabilidad empírica del evento A
$f_{A}$ = frecuencia absoluta del evento A (cuántas veces ocurrió)
$n$ = número total de pruebas u observaciones

Propiedades importantes:

Tema relacionado:
El Teorema de Llaves de Milla: Definición y Explicación

Siempre está entre 0 y 1 (o entre 0% y 100%).
La suma de las probabilidades empíricas de todos los posibles resultados es 1.
Si un evento nunca ocurrió, su probabilidad empírica es 0.
Si ocurrió siempre, su probabilidad empírica es 1.

¿Y si los datos vienen de un estudio existente?

Muy frecuentemente no hacemos el experimento nosotros mismos, sino que usamos datos históricos. Por ejemplo, un hospital registra que de 1200 pacientes con cierto síntoma, 340 tenían gripe. Entonces la probabilidad empírica de que un paciente con ese síntoma tenga gripe es 340/1200 = 0,2833 (28,33%).

En este caso, las «pruebas» son los pacientes observados, y la frecuencia es el subgrupo que cumple la condición.

Ejemplo 1: Control de calidad en una fábrica (básico)

Imagina una fábrica de bombillas. Un inspector toma una muestra de 500 bombillas recién producidas y encuentra que 23 están defectuosas.

¿Cuál es la probabilidad empírica de que una bombilla salga defectuosa?

Aplicamos la fórmula:

Tema relacionado:
¿Qué es un Fenómeno No Caótico en Matemáticas?

$f_{A} = 23$ (bombillas defectuosas)
$n = 500$ (total probado)
$P = 23 / 500 = 0, 046$

Es decir, 4,6% de probabilidad de que una bombilla de esa producción esté defectuosa.

Este dato es oro puro para la gerencia: pueden comparar con el mes anterior, detectar problemas en la línea de ensamblaje o calcular garantías. Observa que no necesitamos saber nada sobre la física de la bombilla; solo contamos lo que ocurrió.

Ejemplo 2: Probabilidad empírica en el lanzamiento de una moneda (convergencia)

Supón que lanzas una moneda 10 veces y obtienes 7 caras. La probabilidad empírica de cara sería 7/10 = 0,7, muy lejos del 0,5 teórico. Pero si lanzas 1000 veces y obtienes 512 caras, la empírica es 0,512, ya cerca del 0,5.

Este ejemplo ilustra la Ley de los Grandes Números: a medida que aumenta el número de pruebas, la frecuencia relativa se estabiliza alrededor de la probabilidad teórica. Por eso en los casinos, aunque un jugador gane unas manos, a la larga la casa siempre gana porque las probabilidades empíricas convergen a las teóricas.

Conclusión práctica: con pocos datos, la probabilidad empírica puede ser engañosa. Con muchos datos, se vuelve muy fiable.

Ejemplo 3: Éxito de un tratamiento médico (aplicación real)

Un laboratorio prueba un nuevo fármaco para la migraña en 850 pacientes. De ellos, 612 reportan una mejoría significativa después de 2 horas.

Probabilidad empírica de que el fármaco sea efectivo:
$P = 612 / 850 = 0, 72$ (72%)

Pero cuidado: esto no significa que cualquier paciente tenga exactamente un 72% de mejorar. Significa que, en esa muestra, la frecuencia fue del 72%. Si la muestra fue representativa, podemos extrapolar a la población general.

Este tipo de cálculo es la base de los ensayos clínicos, los estudios epidemiológicos y muchas decisiones de salud pública.

Ejemplo 4: Predicción del comportamiento del consumidor (marketing)

Una tienda online registra que, de 3200 visitantes a una página de producto, 288 realizan la compra.

Probabilidad empírica de compra = 288/3200 = 0,09 (9%)
Si la tienda espera 5000 visitantes mañana, puede prever alrededor de 5000 × 0,09 = 450 compras.

Este modelo empírico es simple pero poderoso. Mejora si segmentamos: probabilidad de compra para visitantes que llegan desde anuncios vs. desde búsqueda orgánica, etc. La probabilidad empírica, combinada con análisis de datos, impulsa el comercio electrónico moderno.

Ventajas y limitaciones de la probabilidad empírica

Ventajas

Objetiva: se basa en datos reales, no en suposiciones ideales.
Aplicable a cualquier fenómeno repetible, incluso si no conocemos la teoría subyacente.
Útil para validar modelos teóricos: comparas la probabilidad teórica con la empírica.
Fácil de calcular y entender.

Limitaciones

Requiere muchos datos para ser precisa (con muestras pequeñas, puede ser muy variable).
No funciona para eventos únicos (ej: probabilidad de que un volcán específico entre en erupción el próximo año; no tenemos muchas repeticiones).
Depende de la calidad de los datos: si el experimento está mal diseñado o los datos son sesgados, la probabilidad empírica será engañosa.
No predice el futuro por sí sola: te dice qué pasó en el pasado, pero las condiciones pueden cambiar.

Probabilidad empírica vs. frecuencia relativa: ¿son lo mismo?

En la práctica, sí. La frecuencia relativa es exactamente el cociente fA/n. La diferencia es meramente conceptual: la frecuencia relativa describe una muestra; la probabilidad empírica se usa para estimar la probabilidad verdadera de un evento en la población.

Sin embargo, muchos libros y cursos usan ambos términos como sinónimos cuando trabajan con datos observacionales. Lo importante es que entiendas el mecanismo: contar y dividir.

Ejemplo avanzado: Combinación de probabilidades empíricas

Imagina que una plataforma de streaming analiza el comportamiento de sus usuarios:

De 5000 usuarios, 2000 vieron una película de terror en el último mes → P(terror) = 0,4
De esos 2000 que vieron terror, 600 también vieron una comedia la misma semana → P(comedia | terror) = 600/2000 = 0,3

¿Cuál es la probabilidad empírica de que un usuario vea terror y comedia en esa semana?

Usamos la regla de multiplicación para probabilidades empíricas:

P(terror y comedia) = P(terror) × P(comedia | terror) = 0,4 × 0,3 = 0,12

Es decir, un 12% de los usuarios vieron ambos géneros. Este tipo de cálculo es frecuente en sistemas de recomendación y análisis de cohortes.

Cómo calcular probabilidad empírica en Excel o Google Sheets

Si tienes una columna con resultados de un experimento (por ejemplo, «éxito» o «fracaso»), calcular la probabilidad empírica es inmediato:

Usa la función CONTAR.SI para contar las veces que ocurrió el evento.
Divide entre CONTARA o FILAS para el total de pruebas.

Ejemplo: =CONTAR.SI(A2:A101, «éxito») / CONTARA(A2:A101)

Para datos numéricos (ej: cuántas veces sale un número > 4 en un dado), combina CONTAR.SI con condiciones.

Errores comunes al usar probabilidad empírica (y cómo evitarlos)

Generalizar a partir de muestras muy pequeñas – Si solo pruebas 5 bombillas y 1 falla, no concluyas que el 20% de toda la producción falla. La incertidumbre es enorme.
Ignorar cambios en las condiciones – La probabilidad empírica de que un estudiante apruebe un examen basada en datos de 2019 puede no valer para 2025 si el examen cambió.
Confundir correlación con causalidad – Que el 80% de los accidentes ocurran en días lluviosos no significa que la lluvia cause los accidentes (quizás la gente conduce más despacio y eso reduce otros tipos de accidentes… el análisis debe ser cuidadoso).
Aplicarla a eventos únicos – No tiene sentido hablar de probabilidad empírica de que “Argentina gane el próximo mundial” porque no hay múltiples repeticiones del mismo evento.

Relación con la estadística bayesiana (toque avanzado)

La probabilidad empírica es la base del enfoque frecuentista. Pero en estadística bayesiana se parte de una probabilidad inicial (a priori) y se actualiza con datos empíricos para obtener una probabilidad final (a posteriori).

Por ejemplo: un médico cree que una enfermedad tiene una prevalencia del 1% (probabilidad a priori). Tras analizar 1000 pacientes y encontrar 15 casos, la probabilidad empírica es 1,5%. Un bayesiano combinaría la creencia inicial (1%) con los datos nuevos para obtener una estimación intermedia. Ambos enfoques son válidos; el empírico puro simplemente ignora las creencias previas y solo mira los datos.

Aplicaciones reales de la probabilidad empírica

Campo	Aplicación
Medicina	Tasa de éxito de cirugías, efectividad de vacunas
Finanzas	Probabilidad de impago de un préstamo (basada en clientes anteriores)
Ingeniería	Fiabilidad de componentes (vida media, tasa de fallos)
Meteorología	“Probabilidad de lluvia del 30%” – históricamente, cuando las condiciones eran similares, llovió el 30% de las veces
Educación	Porcentaje de alumnos que superan un examen tipo test
Deportes	Porcentaje de tiros libres convertidos por un jugador
Control de tráfico	Probabilidad de que un semáforo esté en rojo a las 9 AM

En todos estos casos, la probabilidad empírica orienta decisiones con evidencia.

Ejercicio resuelto paso a paso para practicar

Problema: Una empresa de mensajería registra los envíos del último año: 12.400 paquetes entregados a tiempo y 1.860 entregados con retraso. Calcula la probabilidad empírica de que un próximo envío llegue con retraso.

Solución:

Total de envíos = 12.400 + 1.860 = 14.260
Evento “retraso” ocurrió 1.860 veces
$P = 1.860 / 14.260 = 0, 1304$

Respuesta: 13,04% de probabilidad empírica de retraso.

La empresa puede usar esto para establecer expectativas con clientes o para mejorar su logística si la cifra es muy alta.

Consejos para presentar probabilidades empíricas en trabajos académicos

Si estás redactando un informe, tesis o artículo:

Especifica claramente el tamaño de la muestra (n).
Indica el período de recolección de datos.
Usa intervalos de confianza si es posible (para reflejar la incertidumbre).
No redondees de forma agresiva: 23/500 = 0,046 (no 0,05).
Distingue entre probabilidad empírica y probabilidad teórica cuando compares.

Resultados de aprendizaje

Después de leer este artículo completo, el estudiante será capaz de:

Definir con precisión la probabilidad empírica y diferenciarla de la probabilidad teórica y subjetiva.
Aplicar la fórmula $P = f_{A} / n$ a situaciones reales (control de calidad, medicina, marketing, etc.).
Interpretar correctamente una probabilidad empírica como una frecuencia relativa observada, no como una certeza absoluta.
Calcular probabilidades empíricas a partir de tablas de frecuencias o conjuntos de datos.
Explicar la Ley de los Grandes Números y su relación con la convergencia entre probabilidad empírica y teórica.
Identificar las limitaciones del enfoque empírico (muestras pequeñas, eventos únicos, cambios en las condiciones).
Resolver problemas combinados que involucren probabilidad empírica condicional (ej: P(A y B) = P(A)·P(B|A) con datos observados).
Utilizar herramientas básicas (Excel, calculadora) para calcular frecuencias relativas en conjuntos de datos reales.
Evaluar críticamente afirmaciones estadísticas que usan probabilidades empíricas sin especificar el tamaño de muestra o la representatividad.
Aplicar el concepto en contextos académicos y profesionales, desde informes de laboratorio hasta análisis de negocios.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador