Confusión y sesgo en la estadística: definición y ejemplos

Rodrigo Ricardo Publicado el 3 noviembre, 2020 4 minutos y 6 segundos de lectura

Problemas con el análisis estadístico

Las estadísticas son herramientas bastante útiles cuando se colocan en las manos adecuadas. Pueden ayudar a los políticos a descubrir cómo planificar mejor sus campañas, alertar a los educadores sobre los estudiantes con necesidades excepcionales, ayudar a los investigadores a crear nuevos medicamentos o brindar a las empresas una idea de cómo actúan sus clientes. Sin embargo, en manos inexpertas, las estadísticas pueden ser más problemáticas de lo que realmente valen. Incluso cuando la intención es honesta, el análisis estadístico a menudo puede probar cosas que están lejos de ser ciertas. En esta lección, veremos dos problemas particulares que afectan las estadísticas, además de ver ejemplos de su incidencia.

¿Qué es confuso?

Al planificar un análisis estadístico, ya sea una simple encuesta o un estudio doble ciego, los investigadores deben tener cuidado de no introducir ningún tipo de problema en la muestra. Después de todo, averiguar lo que predice un conjunto de datos a menudo es lo suficientemente difícil sin tener que clasificar errores adicionales. Cualquier tipo de problema que reduzca la probabilidad de que los datos estadísticos puedan presentar un conjunto de respuestas firmes y realistas se denomina confusión . La confusión puede ocurrir cuando un conjunto de datos se corrompe debido a técnicas de recopilación deficientes, así como cuando todo el experimento se configura sin suficientes controles. Control Sson los métodos utilizados por los estadísticos para asegurarse de que solo se examina el tema en cuestión. Por ejemplo, si fuera a preguntarle a un grupo de personas adineradas dónde fue a la tienda de comestibles, algunos controles incluirían solo preguntar a las personas adineradas o solo a las personas que viven en un área con muchas tiendas de comestibles. Del mismo modo, si estuviera preparando un estudio doble ciego para ver si un refresco era más popular que otro, controlaría por raza, género y antecedentes económicos.

¿Qué es el sesgo?

Mientras que la confusión se refiere a problemas con la estructura de la recopilación de datos, el sesgo se refiere a un problema con la forma en que se recopilan los datos. El resultado final de esto es un conjunto de datos que es drásticamente diferente de la realidad. Hay muchas formas de crear sesgos en los datos. Sesgo de selecciónocurre cuando solo se eligen ciertos individuos para responder una pregunta. En uno de los ejemplos anteriores, estábamos interesados ​​en conocer los hábitos de compra de comestibles de las personas adineradas. Recuerde, la confusión ocurriría al no usar controles como preguntar a las personas con una selección de tiendas de comestibles. El sesgo de selección sería solo encuestando a las personas que compran en un lugar y extrapolando sus respuestas a datos más generalizados. Podría ser que el sitio sea bastante impopular, pero sus datos predecirían lo contrario. De hecho, si el estudio estaba siendo pagado por la tienda de comestibles en cuestión, podría haber acusaciones de sesgo de financiación , en las que se podrían formular preguntas sobre la objetividad del estudio debido a la fuente de financiación del estudio. Además, el sesgo de recuerdo, en el que una persona no puede recordar con precisión los eventos exactos, podría suceder cuando se le pregunta a una persona cuántas veces visitó varias tiendas durante el año pasado. Finalmente, el sesgo del observador podría ocurrir si la persona se deja llevar por la persona que hace las preguntas. Si alguien incluso insinúa lo que podría ser una respuesta correcta, podría ser suficiente para convencer a alguien de que le permita escuchar lo que quiere escuchar.

Resumen de la lección

Incluso las mejores encuestas y sondeos sufren el peligro de confusión y parcialidad. La confusión existe cuando la recopilación de datos no está estructurada adecuadamente con controles suficientes. Recuerde que un control ayuda a asegurarse de que solo se pruebe la variable en cuestión al limitar la entrada de otros factores. El sesgo , por otro lado, es un problema del estudio en sí, no de la forma en que está estructurado.

El sesgo puede existir de muchas formas, que incluyen:

  • Sesgo del observador , que ocurre si la persona que hace las preguntas influye en la persona
  • Sesgo de recuerdo, en el que una persona no puede recordar con precisión eventos exactos
  • Sesgo de financiación , en el que se podrían hacer preguntas sobre la objetividad del estudio debido a la fuente de financiación del estudio, y
  • Sesgo de selección , o cuando solo se eligen ciertos individuos para responder una pregunta

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador