Integración del proceso de consolidación sobre árboles CHAID, CTCHAID, en la plataforma WEKA

Gorka Gutierrez 2021

Finished

Research line:
Comprehensible models
Description:

Se trata de integrar el meta-algoritmo de consolidación, algoritmo CTC, diseñado por el grupo ALDAPA (http://www.aldapa.eus) en la plataforma de código abierto WEKA (http://www.cs.waikato.ac.nz/ml/weka/), sólo que en lugar de usar como algoritmo base el algoritmo de construcción de árboles de clasificación C4.5, usar el algoritmo CHAID.

El algoritmo CTC está basado en el algoritmo de construcción de árboles de clasificación C4.5 propuesto por Quinlan. En la plataforma WEKA existe una implementación de este algoritmo clásico, llamada J48. A día de hoy, también existe una implementación de su consolidación, llamada J48Consolidated, publicada como paquete oficial en http://weka.sourceforge.net/packageMetaData/J48Consolidated/index.html.

Además el grupo ALDAPA dispone recientemente de una implementación también del algoritmo clásico de construcción de árboles de clasificación CHAID, llamada JCHAIDStar.

Estas implementaciones forman parte del material de base para la implementación final propuesta del algoritmo de consolidación del CHAID, CTCHAID.

Una vez llevada a cabo la implementación del algoritmo se realizará una experimentación con un conjunto de problemas de clasificación controlado y los cuatro algoritmos implicados (algoritmos base, C4.5 y CHAID, y algoritmos de consolidación, CTC ó CTC45 y CTCHAID) para analizar los puntos fuertes y débiles de unos y otros en distintos contextos de clasificación.

Responsible researcher:
Jesús M. Pérez
University:
Euskal Herriko Unibertsitatea (UPV/EHU)
Center:
Informatika Fakultatea
Department:
Konputagailuen Arkitektura eta Teknologia
Reading date:
2021-06-30
Reading year:
2021