¿Qué son los datos categóricos?
Cuando los investigadores estudian cualquier concepto, deben recopilar datos relacionados con el concepto. Los datos son información recopilable. Estos datos vienen en muchos tipos diferentes, por ejemplo, altura, peso, color de cabello, opiniones.
Hay dos tipos principales de datos: cualitativos (no numéricos) y cuantitativos (numéricos).
Los datos cualitativos incluyen información como respuestas verbales a preguntas abiertas de entrevistas / encuestas, opiniones, preferencias y / o elementos que no se pueden valorar numéricamente.
Entonces, ¿qué son los datos categóricos? Los datos categóricos son una forma de datos cualitativos que se pueden agrupar en categorías en lugar de medirse numéricamente, como la preferencia de mascotas (perros o gatos). Los datos categóricos no tienen valor intrínseco, ya que las categorías solo pueden compararse, pero no clasificarse de manera mensurable; uno no es más grande que el otro.
![]() |
Algunos ejemplos de datos categóricos son el color de cabello (rojo, rubio o negro), afiliación política (republicano, demócrata u otro) y género (masculino, femenino u otro). Estos se consideran categóricos porque uno no es más que el otro. Por ejemplo, el cabello rojo no es más colorido que el cabello negro, simplemente es diferente. Los datos categóricos separan diferentes categorías de datos sin aplicar un valor definitivo a cada categoría.
Datos categóricos: definición, análisis y ejemplos
En el caso de los datos categóricos, los investigadores a menudo cuentan instancias de elementos que pertenecen a cada categoría con el fin de comparar las categorías. Esto se conoce como resumen de los datos categóricos y no altera el hecho de que los datos siguen siendo categóricos.
Por ejemplo, una clase puede tener 6 personas con cabello largo y 7 personas con cabello corto. Los valores simplemente cuentan las instancias sin indicar que el cabello largo o corto es mejor que el otro.
Tipos de datos categóricos
Dentro de la clasificación de datos categóricos, existen dos tipos de datos categóricos: nominales y ordinales.
Los datos nominales son datos que no tienen ningún orden natural. Los datos nominales se refieren a categorías que no se pueden clasificar. Las razas de animales, los colores y las marcas de productos son solo algunos ejemplos de datos categóricos nominales. No es apropiado decir que los perros son más grandes que los gatos. Un participante en un estudio puede afirmar que se prefieren los perros a los gatos, pero eso no los hace más grandes que los gatos en un sentido mensurable.
Los datos ordinales se refieren a datos que pueden clasificarse u ordenarse de forma natural, pero que no tienen un valor medible continuo. Un ejemplo de este tipo de datos es el tamaño de la ropa (las diferencias pequeñas, medianas y grandes no son medibles, pero están claramente ordenadas para mostrar comparaciones de tallas).
¿Qué son los datos categóricos? – Definición y ejemplos
Ejemplos de datos categóricos
Hay muchos escenarios en los que los investigadores pueden decidir utilizar datos categóricos. Considere estos ejemplos de datos categóricos:
![]() |
- A Rebecca le gusta ir al parque para perros con su perro. Un día se da cuenta de que hay bastantes perros de razas grandes en el parque y los perros más pequeños parecen sentirse incómodos. En un esfuerzo por construir un caso para apoyar la recaudación de fondos para un nuevo parque para perros dedicado a perros pequeños, Rebecca encuesta a los dueños para averiguar qué razas de perros poseen. Luego agrupa las razas por tamaño: pequeño, mediano y grande. Rebecca ha utilizado los datos categóricos nominales de la raza del perro (sin orden natural) para categorizar las razas en una tabla de datos categóricos ordinales lógicos (pequeño, mediano, grande).
- A Alexi le gustan los autos que van rápido. En una exhibición de autos, hay cuatro modelos de autos en la categoría más rápida. Los datos categóricos aquí son el modelo de los autos. Si no se proporciona la velocidad real de los coches, entonces la categoría «más rápida» cuenta como datos categóricos ordinales; sin embargo, si se dan las velocidades reales, esta información no sería categórica, ya que es medible.
- Una encuesta universitaria solicitó a los estudiantes que indicaran dónde les gusta estudiar y cuánto duran sus sesiones de estudio promedio. Este ejemplo también tiene datos categóricos y no categóricos. Los datos categóricos en esta pregunta son la ubicación del estudio, ya que no existe una mensurabilidad intrínseca a un lugar. Sin embargo, la solicitud de proporcionar un marco de tiempo requiere una respuesta medible (el tiempo se puede medir).
Análisis de datos categóricos
Los datos categóricos, es decir, los datos que no son numéricos por naturaleza, a menudo se recopilan en estudios científicos. Este tipo de datos se puede utilizar para mostrar relaciones entre variables y es invaluable para recopilarlos y compilarlos en estudios. Sin embargo, puede resultar difícil de analizar.
Los investigadores a menudo asignan códigos numéricos a los datos categóricos con el fin de poder calcular el análisis estadístico de los datos.
Un ejemplo común de este tipo de análisis de datos categóricos es el conocido sistema GPA, promedio de calificaciones, con el que la mayoría de los estudiantes están sumamente familiarizados. Para calcular un GPA, los primeros códigos numéricos se aplican a las calificaciones categóricas (A, B, C, D o F). Las calificaciones con letras en sí mismas son categóricas, sin valor numérico. Sin embargo, una vez que se asigna un código numérico a cada uno, esos valores artificiales se pueden usar para realizar cálculos estadísticos y obtener información sobre los datos en sí.
Por ejemplo, si un estudiante tiene 2 B, 2 A, 3 C y una D, puede ser difícil comprender la situación académica real del estudiante. Esto es lo que sucede cuando se asignan valores numéricos a las categorías de calificación de letras:
Resumiendo datos categóricos usando tablas
| Calificación | Puntuación A = 4, B = 3, C = 2, D = 1, F = 0 | GPA |
|---|---|---|
| B | 3 | |
| B | 3 | |
| A | 4 | |
| A | 4 | |
| C | 2 | |
| C | 2 | |
| C | 2 | |
| D | 1 | |
| 2.625 |
Es posible sacar conclusiones imparciales basadas en el GPA calculado, que se basa en la asignación artificial de códigos numéricos a calificaciones de letras categóricas. En este caso, se diría que el estudiante con un GPA de 2.625 es un estudiante de nivel medio (o un estudiante de C alta).
Cuando los datos son dicotómicos (como una respuesta sí / no), los investigadores a menudo asignan el valor de 1 a una respuesta y 0 a la otra para poder realizar un análisis estadístico de los datos.
El análisis estadístico más común realizado sobre datos categóricos es descriptivo (recuentos generales en cada categoría) y algunas estadísticas correlacionales (relacionando flujos de datos entre sí para identificar patrones de relación entre los datos). Para realizar estadísticas correlacionales, a todos los datos categóricos se les deben asignar códigos numéricos.
En un estudio para determinar cuánto a la gente le gustan los perros, un investigador aplicó los siguientes códigos:
- Hombre: 1, Mujer: 2, Identificarse como otro: 3
- No me gustan mucho los perros: 1, prefiero otros tipos de animales, pero no me disgustan los perros: 2, me gustan los perros y otros animales igualmente: 3, prefiero mucho los perros sobre otros animales: 4.
Aquí hay una muestra de la cuadrícula de datos del investigador:
| Género | Grado de preferencia |
|---|---|
| 1 | 2 |
| 1 | 1 |
| 2 | 2 |
| 2 | 1 |
| 1 | 2 |
| 3 | 1 |
| 1 | 3 |
| 1 | 1 |
| 3 | 4 |
| 1 | 1 |
| 2 | 1 |
| 2 | 1 |
| 1 | 2 |
| 1 | 3 |
| 2 | 3 |
| 1 | 4 |
Con base en estos datos, el investigador encontró que, en general, el grupo obtuvo un promedio de 2 por el grado en que prefieren los perros (lo que significa que los perros están básicamente bien, pero se prefieren otros tipos de animales). Cuando se ajusta por grupo categórico, el investigador ordenaría los datos por la primera columna para obtener:
| Género | Grado de preferencia | Promedio |
|---|---|---|
| 1 | 2 | |
| 1 | 1 | |
| 1 | 2 | |
| 1 | 3 | |
| 1 | 1 | |
| 1 | 1 | |
| 1 | 2 | |
| 1 | 3 | |
| 1 | 4 | |
| Machos | 2.111 | |
| 2 | 1 | |
| 2 | 1 | |
| 2 | 3 | |
| 2 | 2 | |
| 2 | 1 | |
| Hembras | 1,6 | |
| 3 | 1 | |
| 3 | 4 | |
| Otra identidad | 2.5 |
El investigador puede ver rápidamente que los datos están sesgados hacia los respondedores masculinos (más de lo esperado por casualidad) y que parecen ser los machos los que están sólidamente en el grupo de preferencia ‘Prefiero otros animales, pero no les disgustan los perros’. Los otros datos muestran que las hembras prefieren los perros, en promedio, menos que los machos, pero aquellos que se identifican como otros tienen una preferencia ligeramente más fuerte por los perros que los que se identifican como machos.
Una razón importante para codificar datos categóricos con códigos numéricos es el almacenamiento de datos y el análisis informático; las computadoras requieren números para calcular y la codificación de datos categóricos permite a los investigadores analizar datos que normalmente no están asociados con valores numéricos.
Datos categóricos vs datos cuantitativos
Como se indicó anteriormente, la definición de datos categóricos se relaciona con datos que no son de naturaleza numérica por naturaleza. Algunos datos son naturalmente medibles numéricamente; estos datos se denominan datos cuantitativos.
Los datos cuantitativos a menudo son medidos directamente por el investigador, como un científico que mide la cantidad de pulgadas que crece una vid en la oscuridad versus cuando está expuesta a diferentes cantidades de luz (incluso la cantidad de luz se puede medir en minutos u horas en este ejemplo).
![]() |
Algunos datos se pueden expresar de forma categórica o cuantitativa, como la temperatura. Una representación categórica de la temperatura puede ser fría, cálida o caliente, mientras que una representación cuantitativa de la temperatura indicaría la temperatura en grados (es decir, 94 grados Celsius).
Resumen de la lección
¿Qué significan los datos categóricos? La respuesta a esta pregunta comienza con la definición de datos , información recopilable que se utiliza a menudo en la investigación. Los datos se pueden separar en dos tipos: datos cualitativos (no numéricos) y datos cuantitativos (medibles numéricamente).
Los datos cualitativos se pueden ver en las respuestas a las entrevistas o en otras investigaciones abiertas al estilo de las encuestas. Otra forma de datos cualitativos se llama datos categóricos , datos que se pueden recopilar en grupos y no se prestan a valores numéricos naturales. Ejemplos de datos categóricos son preferencias (como preferencia de mascota), respuestas a preguntas dicotómicas (como preguntas de sí / no), agrupación de colores, agrupaciones de razas o modelos y calificaciones de letras en la escuela.
Hay dos tipos de datos categóricos, nominales (sin orden natural) y ordinales (ordenados naturalmente). Cuando se analizan datos categóricos, se codifican con codificación numérica para permitir que los cálculos estadísticos se apliquen a los datos (como en el caso de un GPA aplicado a las calificaciones con letras).
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...



