¿Cuáles son los pasos del método del árbol de decisión?
1. Selección de funciones
La selección de funciones determina qué funciones se utilizan para emitir juicios. En el conjunto de datos de entrenamiento, cada muestra puede tener muchos atributos y los efectos de diferentes atributos pueden ser grandes o pequeños. Por lo tanto, la función de la selección de características es filtrar características que están altamente correlacionadas con los resultados de la clasificación, es decir, características con fuertes capacidades de clasificación. El criterio comúnmente utilizado en la selección de características es: ganancia de información.
2. Generación de árbol de decisión
Después de seleccionar las características, se activa desde el nodo raíz, se calcula la ganancia de información de todas las características para el nodo y la característica con la mayor. La ganancia de información se selecciona como característica del nodo. De acuerdo con los diferentes valores de la característica, se crean nodos secundarios y se utiliza el mismo método para generar nuevos nodos secundarios para cada nodo secundario hasta que la ganancia de información sea muy pequeña o no haya características para elegir. .
3. Poda del árbol de decisión
El objetivo principal de la poda es combatir el "sobreajuste" y reducir el riesgo de sobreajuste mediante la eliminación activa de algunas ramas.
Introducción
El árbol de decisión es un algoritmo para resolver problemas de clasificación. El algoritmo del árbol de decisión adopta una estructura de árbol y utiliza razonamiento capa por capa para lograr la clasificación final.