Análisis comparativo de datos científicos: definición y ejemplo

Publicado el 8 diciembre, 2020

Análisis científico

¿Alguna vez se preguntó cómo se analizan las muestras de datos para hacer afirmaciones científicas válidas de que la Tierra se está calentando? Una vez que se recopilan los conjuntos de datos de temperatura en formato digital, se puede aplicar el análisis comparativo . Este tipo de análisis simplemente compara uno o más conjuntos de datos para determinar su coherencia entre sí.

Si se encuentra una coherencia entre los conjuntos de datos, se agrega apoyo a una afirmación científica. Tales técnicas pueden involucrar una prueba estadística llamada correlación , que es una cifra cuantitativa que mide la interdependencia de variables. Esta cifra contiene una cantidad entre 0 y 1. Cuanto más cercana sea la correlación a 1 entre dos conjuntos de datos, mayor será su interdependencia.

El análisis comparativo también incluye una técnica para inspeccionar visualmente los datos. Esto se logra mediante la construcción de una serie de tiempo , que es una serie de valores conectados en ciertos puntos a lo largo del tiempo en un gráfico. Al observar visualmente las tendencias (medida del cambio en esa cantidad a lo largo del tiempo) en la serie temporal, puede determinar si los conjuntos de datos tienen coherencia o no.


Ejemplo de una serie de tiempo para la temperatura global y el dióxido de carbono.
ts

En la siguiente sección, discutimos qué conjuntos de datos principales se utilizan en el análisis comparativo para monitorear los cambios en la temperatura de la Tierra. Siempre que alguien debate sobre el cambio climático, se está refiriendo a estos conjuntos de datos.

Conjuntos de datos utilizados para estudiar la temperatura global

En estos días, cualquier persona con una computadora puede descargar datos científicos y gráficos de puntos de datos para un análisis comparativo. Utilizando el ejemplo de la temperatura de la Tierra, primero necesitamos conocer los conjuntos de datos utilizados en el estudio de la temperatura global de la Tierra. Cuando vemos que un conjunto de datos no concuerda con los demás, puede resultar difícil interpretar nuestros hallazgos e identificar las fuentes de error involucradas.

Cuando se habla del cambio climático, hay tres conjuntos de datos científicos que se refieren a las estimaciones de temperatura de la superficie:

  1. HadCRU (Centro Hadley / Unidad de Investigación del Clima)
  2. NOAA (Administración Nacional Oceanográfica Atmosférica
  3. NASA GISS (Instituto Goddard de Estudios Espaciales)

Análisis de la temperatura global de la Tierra

Ahora que está familiarizado con los diferentes conjuntos de datos utilizados para estudiar la temperatura de la Tierra, veremos cómo aplicar el análisis comparativo en ellos. Una vez que se descargan digitalmente, los conjuntos de datos se grafican en una computadora con líneas de conexión que pasan por sus puntos de datos. Estos tres conjuntos de datos no abarcan el mismo período de tiempo. El HadCRU comienza en 1850, mientras que la NOAA y la NASA GISS comienzan en 1880.

Una vez que estos conjuntos de datos se grafican por separado, puede inspeccionar visualmente si coinciden a lo largo del tiempo. Generalmente, estos tres conjuntos de datos concuerdan bien con solo pequeñas diferencias en ciertos años de sus series de tiempo. Para hacer un análisis comparativo más detallado, la correlación descrita anteriormente se puede aplicar para cuantificar su interdependencia y consistencia. Un valor alto más cercano a uno para esta cantidad respaldaría la afirmación de que estos conjuntos de datos son válidos para su uso.


Ejemplo de análisis comparativo de diferentes conjuntos de datos de temperatura global.
análisis

Resumen de la lección

El análisis comparativo es un tipo de método estadístico mediante el cual se comparan dos o más conjuntos de datos para determinar su coherencia entre sí. También puede validar una investigación científica o una hipótesis que necesite ser probada.

Una prueba estadística común dentro de este tipo de análisis de datos para medir la interdependencia de los conjuntos de datos se llama correlación , que es un valor entre 0 y 1.

Otra prueba implica inspeccionar visualmente una serie de tiempo , o gráfico, donde se han construido los puntos de datos del conjunto de datos a través del tiempo. Al observar el gráfico, podemos determinar si existe coherencia entre los conjuntos de datos a lo largo del tiempo.

En nuestro ejemplo, describimos tres conjuntos de datos principales utilizados en el estudio del calentamiento climático. Son los conjuntos de datos GISS de HadCRU, NOAA y NASA. Se han construido en una serie de tiempo y todos se han encontrado similares sin grandes discrepancias.

¡Puntúa este artículo!