Red de conocimiento del abogados - Ley de patentes - ¿Cuáles son los pasos del método del árbol de decisión?

¿Cuáles son los pasos del método del árbol de decisión?

1. Selección de funciones

La selección de funciones determina qué funciones se utilizan para emitir juicios. En el conjunto de datos de entrenamiento, cada muestra puede tener muchos atributos y los efectos de diferentes atributos pueden ser grandes o pequeños. Por lo tanto, la función de la selección de características es filtrar características que están altamente correlacionadas con los resultados de la clasificación, es decir, características con fuertes capacidades de clasificación. El criterio comúnmente utilizado en la selección de características es: ganancia de información.

2. Generación de árbol de decisión

Después de seleccionar las características, se activa desde el nodo raíz, se calcula la ganancia de información de todas las características para el nodo y la característica con la mayor. La ganancia de información se selecciona como característica del nodo. De acuerdo con los diferentes valores de la característica, se crean nodos secundarios y se utiliza el mismo método para generar nuevos nodos secundarios para cada nodo secundario hasta que la ganancia de información sea muy pequeña o no haya características para elegir. .

3. Poda del árbol de decisión

El objetivo principal de la poda es combatir el "sobreajuste" y reducir el riesgo de sobreajuste mediante la eliminación activa de algunas ramas.

Introducción

El árbol de decisión es un algoritmo para resolver problemas de clasificación. El algoritmo del árbol de decisión adopta una estructura de árbol y utiliza razonamiento capa por capa para lograr la clasificación final.