Técnicas de minería de datos

Rodrigo Ricardo Publicado el 10 noviembre, 2020 3 minutos y 46 segundos de lectura

¿Qué buscar?

Quiero que imagines una cantidad realmente enorme de datos: un servidor completo lleno de información. Para ayudar a poner eso en perspectiva, ese debería ser un gimnasio de la escuela secundaria lleno de documentos en papel, ¡incluidos los vestuarios! En definitiva, hay mucha información para analizar. Sin embargo, esa es solo una fracción de la cantidad de información que tienen la mayoría de las empresas. Después de todo, pueden realizar un seguimiento de todo, desde sus pedidos de inventario hasta el historial de compras de cada cliente. La minería de datos les permite poder extraer información útil de todos esos datos. En esta lección, nos centraremos en el papel de las relaciones y el análisis en la minería de datos útil.

Relaciones

Empecemos por las relaciones. No existe información en una burbuja y, francamente, si existe, ¡vale la pena señalarlo! En cambio, es posible que todos esos datos no se vean así al principio, pero todos están interconectados. Al observar las relaciones que surgen entre los elementos de la información, estamos dando nuestro primer paso hacia la minería de datos con éxito. En particular, hay una serie de relaciones diferentes que merecen nuestra atención. Para conceptualizarlos fácilmente, supongamos que es el director de una división de tiendas de comestibles.

  • Las clases se encuentran entre las relaciones más básicas. Este tipo de relación se refiere a las conexiones que ocurren si clasificó a sus clientes por el momento en que compraron o si compraron ciertos artículos al mismo tiempo. Aún así, puede hacer algunas suposiciones a partir de esto. Si nota en una relación de clase que los clientes compran bistec los martes, ¡entonces querrá asegurarse de que su departamento de carnes esté completamente abastecido los martes!
  • También surgen patrones , que en gran medida se explican por sí mismos. Alrededor de agosto, verá un aumento en los útiles escolares. También puede ver una caminata más pequeña en febrero, ya que los crayones rojos de todos finalmente se han agotado. Los patrones muestran una forma típica de hacer algo en una secuencia determinada, aunque no solo se aplica a las épocas del año. También podría surgir un patrón si alguien compra muchos pimientos picantes un día y luego antiácidos al día siguiente.
  • Los clústeres le permiten notar similitudes entre clientes. Quizás los mismos clientes que compran alimentos para bebés también compran bocadillos gomosos. Eso tendría sentido. Pero quizás también notes que una parte importante de ellos también compra una botella de vino cara cada mes. ¡Ahora está notando algunas conclusiones dignas de minería de datos!
  • Las asociaciones nos permiten vincular elementos mucho más lejanos. Esto sucede cuando existe una relación entre dos bienes o ideas que no parece tener sentido, pero se confirma en los datos. Por ejemplo, las personas pueden extrapolar que los padres de niños pequeños ocasionalmente agradecerían una botella de vino para una cita en la casa. Pero, ¿qué pasa con las tarjetas de regalo de las cafeterías? Puede resultar que mientras compran vino para la noche de cita, también reciban tarjetas de regalo de la cafetería como regalo para la tía que está cuidando a sus hijos esa noche. Puede que ese no sea el tipo de conclusión que veía venir, pero las asociaciones lo ayudarán a capitalizar sus hábitos de gasto.

Análisis

Como director, tuvimos que basarnos en lo que proporcionaron los datos para poder seguir adelante. A menudo, el análisis se prestará a ser así de sencillo. Para algunos de los ejemplos anteriores, simplemente poner la información en una hoja de cálculo y presionar ‘ordenar’ habría arrojado algunos de esos resultados. Otras veces, se habrían tenido que utilizar técnicas de regresión más avanzadas o software de visualización. Estos métodos ayudan a diferenciar entre causalidad y correlación, ayudando a las empresas a tomar las mejores decisiones posibles.

Resumen de la lección

En esta lección echamos un vistazo a una serie de técnicas de minería de datos , prestando especial atención a las relaciones y el análisis de las mismas. Se examinaron cuatro relaciones particulares, a saber , clases , patrones , grupos y asociaciones .

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador