Cómo codificar y recodificar datos en Excel

Rodrigo Ricardo Publicado el 20 septiembre, 2020 5 minutos y 3 segundos de lectura

Investigadores de mercado y datos

Thomas ha estado vendiendo música en el área de los tres estados durante más de 30 años. Nunca lo hizo rico, pero ama su trabajo. A medida que se acerca a la jubilación, no puede imaginarse no ir a la tienda todos los días. Sin embargo, es el momento y Thomas comienza los preparativos para decidir si vender la tienda o simplemente cerrarla. Como un caballero mayor, Thomas nunca prestó mucha atención a sus libros. Hizo la mayor parte de sus negocios en papel o con un apretón de manos, y mientras espera su jubilación, su falta de datos se convierte en un dolor de cabeza.

Thomas primero tiene que desglosar información básica sobre sus ventas. Como vive cerca de tres fronteras estatales, sus clientes procedían de casi 12 ciudades de los tres estados. Thomas mantuvo una hoja de cálculo con la información de su cliente, pero en lugar de recopilar la ciudad y el estado de un cliente, Thomas simplemente registró su código postal en una hoja de cálculo de Excel. Ahora que necesita determinar la cantidad de clientes de cada estado, es necesario volver a codificar los códigos postales de Thomas para que pueda obtener una respuesta a su pregunta de investigación.

Comandos de Excel para volver a codificar datos

Esta primera figura muestra los datos actuales de Thomas:

Figura 1. La hoja de cálculo original antes de volver a codificar.
Figura 1

Y la siguiente figura es un ejemplo de cómo quiere Thomas que se vean sus datos después de volver a codificarlos:

Figura 2. Thomas necesita datos que se parezcan más a esto.
Figura 2

Una forma en que Thomas puede lograr esto es usar el comando de Excel BUSCARV . Este comando le permite a Thomas crear una tercera tabla para volver a codificar su lista de códigos postales en una lista de estados. Esta figura muestra este tipo de tabla de codificación:

Figura 3. La tabla de traducción utilizada por Thomas.
figura 3

Una vez que los códigos postales se han vuelto a codificar en uno de los tres estados, se puede usar el comando COUNT para contar el número de clientes por estado.

En un lenguaje sencillo, Thomas quiere indicarle al programa que busque en la columna del código postal, compare el código postal con su tabla de traducción y devuelva la abreviatura del estado en su columna. La fórmula técnica se vería así:

VLOOKUP (lookup_value, table_array, col_index_num, range_lookup)

Este es un gran comienzo para Thomas, pero el resultado aún no es perfecto. Incluso después de usar la tabla de búsqueda, su hoja de cálculo todavía tiene cientos de códigos postales que corresponden a ubicaciones fuera del área de los tres estados. Thomas necesita que todos esos valores se vuelvan a codificar en una única salida. Dado que hay tantos códigos postales huérfanos, una tabla de búsqueda no es práctica. Thomas también podría arreglarlos manualmente si ese es el caso. Dado que eso es ineficiente, Thomas necesita un comando para reemplazar todos los códigos postales huérfanos con un solo valor que quiere llamar «Fuera del estado». Para esto, Thomas puede volver a codificar usando el comando IF .

En un lenguaje sencillo, Thomas quiere indicarle al programa que verifique todos los códigos postales y seleccione las entradas solo SI no comienzan con un 2, 4 o 6. Una vez que se ha ejecutado el IF, ENTONCES Thomas quiere que la aplicación asigne un valor que corresponde a un cliente fuera del estado. La fórmula técnica se vería así:

SI (condición1, valor_si_verdadero1, SI (condición2, valor_si_verdadero2, valor_si_falso2))

Ahora Thomas ha creado las fórmulas para volver a codificar los datos de la tabla inicial, y tiene una fórmula para eliminar los clientes de fuera del estado que no quiere para sus cálculos. Sin embargo, esta es una fórmula engorrosa porque los resultados podrían estar sesgados según el orden en que se ejecutan las fórmulas. Como resultado, la mejor opción de recodificación para Thomas es una sola declaración que consta de los comandos:

  • BUSCARV
  • SI
  • LUEGO
  • MÁS

En términos sencillos, Thomas necesita una fórmula que verifique los valores en la columna del código postal, los compare con la tabla de traducción, devuelva el estado si se reconoce y regresará fuera del estado si no se reconoce.

Figura 4. Asociación de la consulta en inglés simple con los comandos de Excel.
Figura 4

Resumen de la lección

En muchos casos, los investigadores de mercado deben utilizar datos recopilados con un propósito diferente. Cuando hay una necesidad de datos presentes, pero no en la forma correcta, el proceso de recodificación ayuda a convertir los valores a un formato utilizable. Una de las formas más comunes de volver a codificar datos en Excel es usar el comando BUSCARV . Este comando permite al usuario crear una tabla de traducción, donde el valor no utilizable se compara y se convierte en un valor utilizable.

La mayoría de las veces, la relación entre los distintos puntos de datos no es tan simple como A = 1, B = 2, etc. Cuando este es el caso, Excel tiene una secuencia de comandos para ayudar al investigador a administrar los datos. Esta cadena de comandos incluye IF , THEN y ELSE . El comando SI le dice a Excel que realice una acción, como BUSCARV, en un rango específico dentro de la tabla. Una vez que se ha comparado el valor, la instrucción THEN le dice al programa dónde colocar el nuevo valor. Finalmente, la declaración ELSE le dice al programa qué valor devolver si el valor no cumplió con las condiciones para participar en la actividad de recodificación.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador