Análisis estadístico con datos categóricos

Rodrigo Ricardo Publicado el 19 septiembre, 2020 4 minutos y 49 segundos de lectura

¿Qué son los datos categóricos?

Cuando realiza una encuesta o completa formularios de solicitud en varios lugares, se encuentra con datos categóricos. Entonces, ¿qué son exactamente los datos categóricos ? Es el tipo de información que se puede clasificar. Por ejemplo, su raza, género y ocupación son todos tipos diferentes de datos categóricos. Su respuesta para la raza se puede clasificar en grupos como asiático, caucásico, etc. Para la ocupación, su respuesta se puede clasificar en grupos como maestro, estudiante, artista, etc.

Datos como porcentaje

Con este tipo de datos, parte del proceso de análisis implica convertir sus datos en porcentajes. Trabajemos en un escenario de ejemplo para ver cómo funciona el proceso de análisis. Nuestro escenario es que acabamos de encuestar a un grupo de 100 personas sobre su color natural de cabello. Después de revisar todos los datos, encontramos que 30 personas tenían cabello castaño, 20 personas tenían cabello rubio, 40 personas tenían cabello negro y 10 personas tenían cabello rojo. Observe cómo pudimos agrupar a las personas de nuestra encuesta en unos pocos grupos. Para cada persona que respondió de cierta manera, agregamos un 1 para ese grupo. Ahora que tenemos esta información, necesitamos analizarla y presentarla de tal manera que sea fácil de entender y usar. Tener solo nuestros números no nos ayuda mucho. Pero, si cambiamos los números a porcentajes,

Para cambiar nuestros números a porcentajes, tomamos el número de cada grupo y lo dividimos por el número total de datos, y luego convertimos este decimal en un porcentaje multiplicándolo por 100. Para nuestro cabello castaño, dividimos 30 por 100 para obtener 0.3. 0.3 multiplicado por 100 es 30%. Para el cabello rubio, obtenemos un 20%. Para el cabello negro, tenemos el 40% y para el cabello rojo, el 10%.

Tabla de datos

Ahora que tenemos nuestros porcentajes, necesitamos una forma de presentarlos a los demás para que tenga más sentido. Una forma de presentarlo es con una tabla de datos , que es una forma de organizar la información en filas y columnas. Lo presentaremos con una fila de título y nuestra información en dos columnas. La fila del título indicará para qué sirve cada columna. La primera columna es para ‘Color de cabello’ y la segunda columna es para ‘Resultado’. Escribimos nuestros grupos en la columna de Color de cabello, y escribimos nuestros respectivos porcentajes en la siguiente columna.

Color de pelo Resultado
marrón 30%
Rubia 20%
Negro 40%
rojo 10%

Podemos echar un vistazo a nuestra tabla terminada y obtener rápidamente la información que necesitamos. Podemos verlo y ver fácilmente que el 40% de nuestra población tiene cabello negro. Podemos utilizar esta información con fines comerciales si queremos comercializar accesorios para el cabello para personas. Si sabemos que la mayoría de nuestra población tiene cabello negro, produciremos más accesorios que combinen con el cabello negro.

Gráfico de barras

Otra forma en que podemos presentar nuestra información, lo que facilitará su análisis, es con el uso de un gráfico de barras , un gráfico que muestra nuestros datos mediante barras. La forma en que creamos un gráfico de barras es escribiendo nuestros diversos grupos en el eje x, y luego dibujamos barras de varias alturas para corresponder con el número de personas en cada grupo. Nuestro primer grupo que escribimos es Brown, y nuestra barra tiene una altura de 30 porque esa es la cantidad de personas en este grupo. Lo mismo hacemos con el resto de grupos. El rubio tiene una altura de barra de 20, el negro tiene una altura de barra de 40 y el rojo tiene una altura de barra de 10. Podemos mirar fácilmente este gráfico de barras a continuación y ver qué grupo es más popular y qué grupo es la minoría.

Ejemplo de gráfico de barras con datos de color de cabello
ejemplo de gráfico de barras con datos de color de cabello

En mi gráfico de barras, decidí mantener los números en lugar de usar porcentajes. ¿Por qué? Porque en un gráfico de barras, es fácil ver qué barra es más alta que otra. Sin embargo, en forma de tabla, es más fácil comprender la información si se presenta mediante porcentajes. También puede usar los porcentajes para las alturas de sus barras en su gráfico de barras. Puede utilizar el que crea que transmitirá la información de la mejor manera. Puede graficar ambos para comparar y luego elegir el que sea más fácil de leer.

Resumen de la lección

En resumen, los datos categóricos son datos que se pueden clasificar en grupos. Los ejemplos incluyen género, ocupación y raza. Las dos formas de analizar esta información es con el uso de una tabla de datos , información presentada en filas y columnas, o un gráfico de barras , un gráfico con barras de varias alturas. Para una tabla de datos, si bien puede informar sus datos utilizando los números de cada grupo, la mayoría de las veces tiene más sentido informar los grupos utilizando sus porcentajes. Para el gráfico de barras, puede graficarlo usando los porcentajes o los números para cada grupo. Elija el que tenga más sentido para su situación. Grafique ambos para ver cuál es más fácil de leer y comprender.

Los resultados del aprendizaje

Complete esta lección para que pueda:

  • Proporcione ejemplos de datos categóricos
  • Analice datos categóricos utilizando una tabla de datos y un gráfico de barras
  • Sepa cuándo usar porcentajes y cuándo usar números al evaluar datos categóricos

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador