Analizando los datos
Finalmente ha completado su experimento y tiene todos estos datos. Ahora, ¿qué significa eso? ¿Cómo se supone que debes entender cómo todo responde a tu pregunta? ¿Su hipótesis quedó sin respuesta? Hay varias cosas diferentes que puede hacer para determinar qué le dicen los datos. Deberá poder buscar cualquier patrón que pueda existir y organizar los datos de determinadas formas. Esto dependerá del tipo de datos recopilados y de lo que esté tratando de determinar.
Comparación de dos grupos
Digamos que aprendió que la edad promedio en los Estados Unidos era de 38 años. Piensas: «Creo que la gente que vive en mi calle es mucho más joven que el promedio nacional». Entonces hiciste una observación, luego creaste una pregunta en la que preguntaste «¿Es la edad promedio de las personas que viven en mi calle la misma que la edad nacional de los Estados Unidos?» Sal y encuentra las edades de todos los que viven en su calle y obtiene alrededor de 20 resultados diferentes. Primero, debe determinar la edad media de estos datos. ¿Cómo haces esto? Una forma sería crear un diagrama de tallo y hojas de los datos. Un diagrama de tallo y hojas organiza los números de menor a mayor colocando los primeros dígitos como ‘tallo’ y el último dígito como ‘hoja’. Entonces, primero organizamos los datos de menor a mayor: 1, 2, 5, 8, 11, 15, 15, 16, 25, 35, 35, 36, 41, 43, 55, 65, 72, 76 y 99. Ahora pongámoslo en un diagrama de tallo y hojas:
![]() |
Primero, encontremos la mediana. Hay un total de 19 puntos de datos, por lo que el punto medio es el décimo punto de datos:
![]() |
Entonces, la edad promedio de las personas en su calle es de 35 años. Esto es un poco más bajo que el promedio nacional, pero realmente no mucho. Pero hay algo más que podemos ver en este diagrama de tallo y hoja. Observe el 99 en esta gráfica, está muy lejos del resto de los datos, incluso saltamos un grupo completo de decenas antes de llegar a 99. Por lo tanto, se puede considerar un valor atípico. Un valor atípico es algo que es considerablemente diferente del resto del grupo. A menudo sacamos valores atípicos de nuestros conjuntos de datos. Así que ahora saquemos el 99 y veamos nuestra nueva mediana:
![]() |
Dado que ahora hay 18 puntos de datos, el punto medio se encuentra entre el noveno y el décimo punto de datos. El noveno punto de datos es 25 y el décimo punto de datos es 35. La mitad entre estos dos números es 30. Entonces, la nueva mediana de edad es 30 años, que es bastante más joven que la mediana nacional. Entonces, podríamos concluir que la edad promedio de las personas en su calle es más baja que el promedio nacional.
Controles y variables en Experimentos Científicos: Definición y ejemplos
Correlación
Ahora veamos una correlación, que es cuando estamos viendo si dos cosas se afectan entre sí. Digamos que querías saber si bebiste más agua cuantas más palomitas de maíz comieras en el cine. Fuiste al cine varias veces y mediste la cantidad de palomitas de maíz que comiste y el agua que consumiste cada vez. Terminaste con estos datos:
![]() |
Con este tipo de datos, es más fácil ver la correlación dibujando un diagrama de dispersión , que es un gráfico con cada uno de los puntos de datos trazados:
![]() |
Luego dibujamos una línea recta que está aproximadamente a la misma distancia de cada punto, esta es la línea de mejor ajuste . A veces, esto puede ser difícil de dibujar, pero simplemente use una regla y se vuelve mucho más fácil.
![]() |
Ahora veamos esta línea, si se inclina hacia abajo, lo que significa que hay una correlación negativa entre el consumo de palomitas de maíz y el consumo de agua. En otras palabras, cuantas más palomitas de maíz coma, menos agua beberá. Si tuviera una pendiente ascendente, entonces habría una correlación positiva (a medida que una aumenta, también aumenta la otra). Aunque esta línea está ligeramente inclinada hacia abajo, es casi una línea horizontal recta, no tiene una pendiente muy pronunciada. Y cada uno de los puntos está bastante lejos de la línea. Esto nos dice que no existe una correlación muy fuerte entre las palomitas de maíz y el consumo de agua. Así que podríamos concluir que existe una leve correlación inversa entre el consumo de palomitas de maíz y la ingesta de agua, pero no una correlación (o conexión) muy fuerte. Como la línea se vuelve demasiado empinada y se convierte en una línea vertical, esto también indica una correlación débil.
Resumen de la lección
Hay varias formas diferentes de analizar datos. Hay dos tipos principales de datos para analizar, comparaciones y correlaciones. Al analizar los datos de comparación, queremos ver si la mediana o el promedio es diferente entre dos conjuntos de datos. Al utilizar un diagrama de tallo y hojas , podemos encontrar fácilmente la mediana de un conjunto de datos y podemos identificar valores atípicos (datos considerablemente diferentes del resto del grupo). Al analizar los datos de correlación, queremos ver si una cosa afecta a la otra. Esto es más fácil de ver con un diagrama de dispersión , un gráfico con cada uno de los puntos de datos trazados. Luego, dibuje una línea de mejor ajuste , una línea recta aproximadamente a la misma distancia de cada punto. Si la línea está inclinada hacia arriba, entonces hay una correlación positiva (una aumenta a medida que aumenta la otra). Si la línea está inclinada hacia abajo, entonces hay una correlación negativa (una disminuye a medida que la otra aumenta). La pendiente de la línea nos dice si la correlación es débil o fuerte. Una línea recta horizontal o vertical no tiene una fuerte correlación. Si varios de los puntos de datos están lejos de la línea, esto también indica una correlación débil.
Protección de dispositivos móviles: tipos e identificación
¿Qué avances científicos podemos esperar en el futuro?
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...






