Análisis estadístico: uso de datos para encontrar tendencias y examinar relaciones

Rodrigo Ricardo Publicado el 14 septiembre, 2020 7 minutos y 44 segundos de lectura

Dar sentido a los datos

La cantidad de datos que los humanos generamos todos los días es abrumadora. Tenga en cuenta que cada compra de cualquier producto en cualquier lugar es un dato. Cada llamada telefónica es un dato. Cada publicación en las redes sociales es un dato. Los avances en los sistemas informáticos permiten almacenar todos estos datos.

Un director ejecutivo de una importante empresa de tecnología dijo recientemente que la humanidad ahora crea tantos datos todos los días como lo hicimos desde los albores de la civilización hasta el año 2000. ¡Eso es un montón de datos! Y el ritmo al que generamos los datos sigue aumentando.

¿Cómo le damos sentido a todos estos datos? Supongamos que tiene una empresa que fabrica accesorios para teléfonos móviles y los vende a tiendas minoristas. Quiere saber cómo van las ventas. Uno de sus gerentes le dice que el equipo de ventas realizó ventas a 800 tiendas minoristas en enero. ¿Quieres ver 800 informes de ventas diferentes? No, quieres algún tipo de resumen. Por ejemplo, es posible que desee saber el total de todas las ventas combinadas y el valor promedio de esas ventas. O tal vez desee ver las 10 mayores ventas. Puede obtener esta información mediante análisis estadístico .

La estadística es un campo de estudio dentro de las matemáticas. Implica la recolección, análisis, interpretación y presentación de datos para la toma de decisiones en las organizaciones. Muchas organizaciones diferentes utilizan el análisis estadístico para describir y analizar datos y predecir tendencias futuras.

Estadísticas descriptivas

Existen varios tipos de estadísticas. El primer tipo es la estadística descriptiva , que hace exactamente lo que sugiere el término. Describe los datos existentes, utilizando medidas como promedio, suma y otras. Este es el ejemplo anterior de los informes de ventas. Desea saber cosas como el valor total de todas las ventas combinadas y el valor promedio de esas ventas.

Las estadísticas descriptivas le permiten resumir grandes cantidades de datos. Los usa regularmente en la vida cotidiana, por lo que son muy intuitivos. Cuando dice que sale a cenar en promedio dos veces por semana, está usando estadísticas descriptivas. O considere su GPA en la escuela secundaria o la universidad. Su GPA es una medida de su calificación promedio para todos sus cursos. La estadística descriptiva también analiza la variabilidad de los datos. Por ejemplo, si tu GPA es exactamente 3.0, ¿obtuviste principalmente B o obtuviste muchas A y C? Ambos casos dan como resultado el mismo promedio pero representan un expediente académico muy diferente.

Estadística inferencial

El segundo tipo es la estadística inferencial , que intenta inferir algo sobre los datos. En otras palabras, está intentando encontrar patrones y relaciones en los datos. La estadística inferencial a menudo implica pruebas estadísticas. Por ejemplo, supongamos que desea aumentar las ventas de su empresa, que fabrica accesorios para teléfonos móviles. Vende sus productos a tiendas minoristas de todo el país y va a realizar una campaña publicitaria en la televisión con la esperanza de aumentar la demanda de sus productos.

Este tipo de publicidad es cara, por lo que empezará poco a poco y verá si realmente funciona. Vas a publicar un anuncio de televisión en canales locales solo dentro del estado de California durante dos meses. Entonces querrá ver cuánto ha aumentado la demanda de su producto. Hay 100 tiendas minoristas en California y 700 en el resto del país. Una forma sencilla de ver esto sería calcular cuánto aumentaron sus ventas en las tiendas de California después de la publicidad en televisión. Entonces puedes calcular si la publicidad valió la pena.

Sin embargo, sabe por experiencia que las ventas pueden fluctuar como parte del negocio normal. Las ventas pueden subir o bajar para cualquier tienda en cualquier mercado. Entonces, si encuentra que, en promedio, las ventas en California aumentaron, ¿qué confianza puede tener en su resultado? Tal vez fue solo una fluctuación en las ventas y no un aumento real debido a la publicidad.

¿Cómo puede determinar que su dinero publicitario fue una buena inversión? ¡Es hora de la estadística inferencial! Vas a hacer una prueba estadística para determinar qué tan seguro estás de que realmente existe una diferencia importante en las ventas entre California y el resto del país. En este caso, crearía dos grupos: el grupo uno con 100 tiendas en California y el grupo dos con 700 tiendas en el resto del país. Luego haces una prueba para comparar grupos. No nos preocupemos por qué prueba exactamente: hay muchos tipos diferentes, cada uno para diferentes circunstancias.

El resultado de la prueba sería algo como esto: Tenemos un 95% de confianza en que las ventas mensuales por tienda aumentaron en un promedio del 10% o más en los tres meses posteriores a la campaña publicitaria. ¿Por qué el 95%? Bueno, en estadísticas, nunca estamos 100% seguros porque nunca tendrías suficientes datos para mostrar esto con absoluta certeza. Entonces, el 95% es un buen comienzo. Con un resultado como este, puede calcular si la inversión en publicidad valió la pena.

Los resultados de una prueba también pueden no ser concluyentes. Si las ventas no aumentaron mucho, es posible que no pueda decir nada con confianza sobre si las ventas realmente aumentaron o no. Eso no es lo que quería escuchar, pero es mejor saberlo ahora que después de haber lanzado una campaña multimillonaria en todo el país.

Estadísticas predictivas

El tercer tipo son las estadísticas predictivas , que intentan predecir las condiciones futuras en función de los datos existentes. Considere un ejemplo de estadísticas predictivas con las que ya está familiarizado: pronóstico del tiempo. Está planeando un viaje de senderismo para el fin de semana y el miércoles le gustaría saber qué tiempo hará el sábado y el domingo. Verifica el pronóstico del tiempo y va a estar soleado y cálido con muy pocas posibilidades de lluvia. Los meteorólogos utilizan datos históricos y observaciones recientes de la atmósfera para realizar este pronóstico. ¿Puede estar 100% seguro de que no necesitará un impermeable? No, pero es mucho más probable que sea agradable y soleado.

Volvamos a su empresa que fabrica accesorios para teléfonos móviles. Este es un mercado de moda y hay que mantenerse en la cima. Uno de los principales fabricantes de teléfonos presenta un nuevo modelo totalmente genial. Cree que le irá bien, por lo que ha alineado la producción de varios accesorios únicos. Sin embargo, aún debe decidir los mejores colores para usar. Esto puede ser complicado porque no querrás quedarte atascado con 10,000 fundas rosas para teléfonos. ¿Qué colores van a atraer a los usuarios de este nuevo modelo?

Un enfoque sería mirar sus propios datos de ventas para cuando se hicieron presentaciones similares en el pasado: diferentes teléfonos, diferentes marcas, pero dirigidos al mismo tipo de usuario. Entonces, comienza a analizar sus datos. ¿Qué otros teléfonos se parecían más? ¿Qué colores funcionaron mejor? ¿Tonos grises elegantes para la gente de negocios o amarillos y verdes llamativos para los adolescentes? Puede desarrollar un modelo estadístico para predecir qué colores funcionarán mejor en función de sus datos existentes. Y luego, usará este modelo para planificar su producción. ¿El modelo será exacto? Lo más probable es que no, pero puede darle una ventaja competitiva cuando salga el nuevo teléfono.

Software estadístico

El análisis estadístico requiere el uso de software estadístico. Los programas de hojas de cálculo incluyen una serie de funciones estadísticas integradas. Sin embargo, el análisis estadístico más avanzado normalmente requiere funciones especializadas.

Para realizar análisis estadísticos, necesita organizar y gestionar sus datos. El software estadístico, por lo tanto, tiene una serie de funciones que lo hacen similar a un sistema de administración de bases de datos, o DBMS. Sin embargo, cuando se trabaja con bases de datos muy grandes y complicadas, es común administrar estos datos utilizando un DBMS dedicado y solo exportar partes de los datos para su uso en software estadístico. El software estadístico generalmente incluye todos los diferentes tipos de estadísticas, incluidas las estadísticas descriptivas, inferenciales y predictivas. También contiene la capacidad de hacer gráficos como parte de la descripción de sus datos.

Resumen de la lección

La estadística consiste en la recolección, análisis, interpretación y presentación de datos para la toma de decisiones en las organizaciones. Los diferentes tipos de estadísticas incluyen estadísticas descriptivas , inferenciales y predictivas . Se utiliza un software estadístico especializado para realizar análisis estadísticos .

Los resultados del aprendizaje

Después de completar esta lección en video, podría:

  • Definir estadísticas y explicar por qué son importantes.
  • Resalte tres tipos de estadísticas
  • Interpretar los usos del software estadístico

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador