Cómo diseñar un experimento estadístico

Rodrigo Ricardo Publicado el 23 noviembre, 2020 5 minutos y 22 segundos de lectura

Diseñar un experimento estadístico

Los estadísticos recopilan información mediante estudios y experimentos de observación. Los estudios observacionales observan y miden características específicas sin modificar los sujetos en estudio. En contraste, un experimento estadístico aplica un tratamiento a los sujetos para ver si existe una relación causal. (Los tratamientos también pueden denominarse factores, pero esto puede resultar confuso porque las variables latentes en el análisis factorial también se denominan factores). Los experimentos estadísticos están diseñados para comparar los resultados de aplicar uno o más tratamientos a unidades experimentales y luego comparar los resultados con un control. grupo que no recibe tratamiento.

El diseño de un experimento estadístico comienza con la identificación de las preguntas que desea responder. Al planificar cuidadosamente todos los detalles del experimento por adelantado, disminuye la probabilidad de errores y aumenta la probabilidad de que el experimento produzca buenos datos que lleven a conclusiones sólidas después del análisis.

Caso de muestra

Un agricultor quiere probar un nuevo tipo de fertilizante para ver si mejora el rendimiento de su cultivo de soja. Plantará dos secciones de un campo (unidades experimentales). El agricultor aplicará fertilizante a uno (tratamiento) y dejará que el otro crezca en condiciones normales (control). Después de la cosecha, comparará los resultados ( análisis estadístico ) para ver qué sección produjo más soja. Finalmente, llegará a una conclusión basada en la evidencia recopilada. Sin embargo, tendrá en cuenta las suposiciones que hizo y que pueden requerir una investigación adicional.

Definiendo la Pregunta

El propósito de un experimento es ver si la aplicación de un tratamiento da como resultado diferencias observables en las unidades experimentales. Para que una diferencia importe, debe ser mensurable. Para este caso de muestra, usaremos la pregunta: ¿La aplicación del nuevo fertilizante da como resultado más soja por metro cuadrado que el cultivo de soja sin el fertilizante?

Definiendo las Variables

La variable independiente es la que planea cambiar. En este caso de muestra, la variable independiente es el tratamiento con el nuevo fertilizante. La variable dependiente es lo que planea medir después del tratamiento. En este caso, la variable dependiente es la cantidad de soja por metro cuadrado. La mayoría de los estudios de la vida real también tienen variables extrañas que afectan los resultados del experimento. Las variables extrañas en un estudio agrícola pueden incluir la cantidad de lluvia, luz solar o poblaciones de insectos.

A menudo hay variables que ni siquiera conoce. Una variable de confusión es una variable extraña que varía a lo largo de la variable independiente. En este ejemplo, parte del suelo puede tener una química ligeramente diferente que no probamos.

Los investigadores pueden diseñar experimentos estadísticos para estudiar varios tratamientos y variables. Por ahora, mantendremos el caso de muestra simple para que pueda dominar los conceptos básicos.

Configurar los controles

En un experimento estadístico, desea controlar las variables extrañas manteniéndolas constantes. En este experimento, podemos controlar varias de las variables extrañas colocando las áreas de prueba cerca una de la otra. Queremos que ambas áreas reciban la misma cantidad de sol, lluvia y atención de los insectos locales.

Aleatorización

También podemos controlar variables extrañas mediante la aleatorización . En la aleatorización, intentamos controlar el impacto de variables extrañas asignando tratamientos al azar a los elementos de un experimento. La asignación aleatoria no es muy efectiva en experimentos con solo unas pocas unidades experimentales, por lo que no ayudará en este caso de muestra. Si expandimos el experimento a cientos de parcelas de tierra, podríamos aleatorizar qué parcelas reciben tratamiento para disminuir el impacto de variables extrañas.

Control del sesgo en experimentos estadísticos

El sesgo incluye todo lo que influye en los resultados experimentales a favor de uno u otro resultado. El sesgo puede deslizarse en un experimento en cualquier etapa, por lo que debe planificar para evitar el sesgo tanto como sea posible. La mayoría de los experimentos tendrán un elemento de sesgo presente. Incluso los estudios publicados bien recibidos tienen cierto grado de sesgo, pero estos estudios están diseñados para minimizar el sesgo e identificar cualquier sesgo que ocurra.

Quizás se pregunte cómo podría estar presente el sesgo en este caso de muestra. ¿Qué forma imaginaba que tendrían las parcelas de tierra? Es normal suponer que las gráficas serían rectangulares si hubiera pensado en la pregunta.

Análisis de los datos

El análisis de datos es la aplicación de uno o más métodos estadísticos a los datos que recopila de un experimento. El análisis de datos no tiene por qué ser complejo. Puede ser tan simple como comparar dos medidas en un histograma o puede involucrar métodos complejos como regresión y ANOVA. Para este experimento de muestra, usaremos una comparación de la cantidad de frijoles producidos en cada parcela. En el mundo muy simple de este caso de muestra, eso es suficiente. En el mundo real, el agricultor querría saber mucho más, por lo que podría recopilar datos sobre muchas variables y el análisis de datos será más complejo.

Conclusiones y supuestos

Después de analizar los datos, puede comenzar a sacar conclusiones sobre el experimento. Antes de sacar conclusiones, es importante identificar las suposiciones que hizo durante el experimento. En el caso de la muestra, teníamos una suposición muy simple. Asumimos que la cantidad de fertilizante aplicada era la cantidad óptima para comparar con las condiciones de control. Si estuviéramos haciendo el estudio en el mundo real, probablemente tendríamos varios tratamientos diferentes con diferentes cantidades de fertilizante.

Resumen de la lección

En esta lección, usamos un caso de muestra para aprender la estructura básica de un experimento estadístico. Un agricultor planta dos parcelas de soja ( unidades experimentales ). Trata el primero con un nuevo fertilizante ( variable independiente ) y deja el segundo sin tratar (el control ). Después de la cosecha, mide la cantidad de soja producida por cada parcela ( variable dependiente ). Finalmente, compara las cantidades ( análisis de datos ) para ver qué parcela produjo más soja.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador