Algoritmo de árbol de decisión en minería de datos

Rodrigo Ricardo Publicado el 10 noviembre, 2020 4 minutos y 15 segundos de lectura

Obtener más de sus datos

Los datos impulsan nuestro mundo. Hoy en día, no hay una empresa que no dependa de datos de algún tipo. Como mínimo, miran los datos de ingresos y gastos, tratando de mantener su negocio rentable. Además, las empresas analizan las cifras de ventas para predecir las horas pico y optimizar los niveles de existencias. ¿Es de extrañar que quieran aprender más y más de sus datos? ¡Obviamente no! Y sus técnicas, como los árboles de decisión y la minería de datos, pueden ayudar.

¿Qué es un árbol de decisiones?

Un árbol de decisiones es un diagrama de relaciones jerárquicas que se utiliza para determinar la respuesta a una pregunta general. Para ello, formula una secuencia de subpreguntas relacionadas con esa pregunta. Cada rama del diagrama representa una posible elección o respuesta a una subpregunta específica. Y cada subpregunta reduce iterativamente el número de opciones restantes, o respuestas, hasta que solo queda la correcta para la pregunta general, en esa situación particular.

Ejemplo de árbol de decisión meteorológica
Árbol de decisión meteorológica

Veamos un ejemplo. En el diagrama de arriba, la pregunta general es: «¿Hace buen tiempo para salir?» Esta no es una pregunta sencilla de responder. Hay una serie de factores a considerar. Cada burbuja del diagrama representa un factor o una subpregunta, y cada línea representa una opción o respuesta a la subpregunta anterior.

Entonces, la primera subpregunta que nos hacemos es: ‘¿Hace viento?’ Si es así, bajamos por la izquierda del diagrama, si no, bajamos por la derecha. Digamos que hace viento. Eso nos lleva a la pregunta ‘¿Cuál es la perspectiva?’ subpregunta. Si la respuesta es soleada, bajamos por la izquierda, si está nublado por el centro y si llueve, por la derecha. Digamos que hace sol, así que bajamos por la izquierda. Luego, la siguiente subpregunta es ‘¿Cuál es la humedad?’. Si la humedad es inferior al 80 por ciento, la respuesta a la pregunta general es «Sí». Y si la humedad es superior al 80 por ciento, la respuesta es «No».

¿Qué es el algoritmo del árbol de decisiones?

El algoritmo del árbol de decisiones formaliza este enfoque. Proporciona un método sistemático para responder preguntas y resolver problemas, que los negocios y las ciencias de la computación gustan de usar. Un ejemplo común es el área de soporte de productos. Si llama a una empresa como Dell para pedir ayuda con uno de sus artilugios, será transferido a un especialista en soporte. Esta persona hará una serie de preguntas, destinadas a reducir iterativamente el número de posibles soluciones. ¿Sin duda ha encontrado algo similar? Esto continúa hasta que se encuentra el correcto. La serie de preguntas es parte del guión escrito con el que trabaja el especialista en soporte, y el algoritmo que utiliza es un árbol de decisiones.

¿Qué es la minería de datos?

La minería de datos es el proceso de examinar grandes cantidades de información con el propósito de reconocer características útiles sobre los datos. Por ejemplo, empresas como McDonald’s utilizan regularmente su información de ventas para predecir cuándo son los mejores meses para ofrecer productos de temporada como McFlurry. O las autoridades de tránsito locales pueden usar los hábitos de conducción para determinar las horas pico y programar más autobuses en respuesta. En cada caso, la minería de datos se utiliza para reconocer un patrón y tomar alguna acción basada en el patrón.

¿Cómo se usa el algoritmo del árbol de decisión en la minería de datos?

La relación entre el algoritmo del árbol de decisiones y la minería de datos es directa. La minería de datos quiere reconocer patrones útiles en grandes conjuntos de datos, y el algoritmo del árbol de decisión es un medio para reconocer esos patrones. Si piensa en el ‘¿Hace buen tiempo para salir?’ En el ejemplo anterior, el árbol de decisiones permanecería igual, las preguntas permanecerían igual y también las opciones. Donde entran los datos es en las respuestas. No tanto por las condiciones actuales, podemos buscar eso afuera. Más bien, considere la información histórica y cómo se puede usar para predecir la respuesta con días o meses de anticipación. Como puede ver, esto es muy poderoso y se usa comúnmente en la actualidad.

Resumen de la lección

Un árbol de decisiones es un diagrama jerárquico que se utiliza para responder una pregunta general. Se divide en una serie de subpreguntas, cada una con una o más opciones o respuestas. El algoritmo del árbol de decisiones formaliza este enfoque. La minería de datos es el proceso de reconocer patrones en grandes conjuntos de datos. Cuando se usa con árboles de decisión, se puede usar para hacer predicciones basadas en los datos.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador