foto perfil

Conceptos básicos de la minería de datos

Publicado el 6 septiembre, 2020

¿Qué es la minería de datos?

Si bien existe un gran interés en el papel de los macrodatos para tomar decisiones, la verdad es que muchas empresas tienen muchos datos en sus propios servidores. Es solo cuestión de saber utilizarlo. Mediante el uso de la minería de datos , las empresas están en mejores condiciones de sacar nuevas conclusiones utilizando datos que ya saben que son ciertos y examinándolos de una manera nueva. Una excelente manera de pensar en esto es que las estadísticas del béisbol están llenas de análisis diferentes con los que comparar diferentes jugadores, aunque el número total de acciones que un jugador determinado puede realizar es bastante limitado.

Esta es una gran ventaja sobre los macrodatos, que en virtud de su gran tamaño es probable que permita que los errores se abran paso en la mayor parte de la información. En esta lección, veremos cómo funciona la minería de datos para empresas de todos los tamaños. Luego, veremos un ejemplo que lo muestra en acción.

¿Como funciona?

Anteriormente, hice referencia al béisbol como un gran ejemplo de minería de datos. En realidad, es un gran ejemplo de cómo funciona el campo. Los datos brutos se analizan de diferentes formas, creando nuevas formas de ver la misma información. Se utiliza una amplia gama de análisis estadísticos y basados ​​en regresiones. Al final, el propietario de los datos tiene acceso a información que puede no ser evidente de inmediato, pero tiene sentido con respecto a los datos.

Ejemplo

Sin profundizar demasiado en las matemáticas necesarias, echemos un vistazo a cuándo la minería de datos puede ser útil y cómo podría hacerlo una empresa. Digamos que es una empresa de consultoría que ayuda a las personas a crear bases de datos para su información. Ha tenido cierto nivel de éxito y en los últimos años ha acumulado una base de clientes sustancial que lo contrata como anticipo, así como una serie de empresas que lo contratan de vez en cuando. Su pregunta es ¿cuánto negocio puede esperar de una región geográfica en particular en un momento futuro? Los datos brutos por sí solos solo pueden mostrarle lo que sucedió en el pasado.

Aquí es donde la minería de datos puede resultar útil. Incluso rascando la superficie de la minería de datos, podemos ver si hay una tendencia en esa región. ¿Está ganando o perdiendo negocios? Además, ¿existen circunstancias atenuantes que hayan provocado diferencias en las cifras comerciales durante los últimos trimestres? Eso no es todo. La minería de datos también puede ayudarnos a determinar si podemos esperar que algunos de los clientes que nos contratan según sea necesario nos llamen en el trimestre determinado. De hecho, la minería de datos incluso nos diría qué consultores y diseñadores de bases de datos debemos enviar para obtener los mejores resultados en esa región geográfica en particular. Nuevamente, todo esto sería imposible con solo mirar los datos.

Resumen de la lección

La minería de datos es el proceso mediante el cual se manipula una determinada cantidad de datos sin procesar para encontrar nueva información. En resumen, es muy similar a las estadísticas del béisbol. Los datos se alimentan a través de una serie de análisis estadísticos diferentes para demostrar información significativa.

Articulos relacionados