Integración del proceso de consolidación sobre árboles CART, CTCART, en la plataforma scikit-learn

Jon Ochoa de Alda 2025

En curso

Línea de investigación:
Explainable models
Descripción:

Se trata de integrar el meta-algoritmo de consolidación, algoritmo CTC, diseñado por el grupo ALDAPA (http://www.aldapa.eus) en la plataforma de Machine Learning desarrollada en Python scikit-learn (https://scikit-learn.org/), sólo que en lugar de usar como algoritmo base el algoritmo de construcción de árboles de clasificación C4.5, usar el algoritmo CART.

El algoritmo CTC está basado en el algoritmo de construcción de árboles de clasificación C4.5 propuesto por Quinlan. La plataforma de Machine Learning WEKA (http://www.cs.waikato.ac.nz/ml/weka/), desarrollada en Java, contiene una implementación del algoritmo C4.5 llamada J48 y, basada en ésta, el grupo ALDAPA ha desarrollado una implementación del algoritmo CTC llamada J48Consolidated, aceptada como paquete oficial en Weka (http://weka.sourceforge.net/packageMetaData/J48Consolidated/index.html).

Además scikit-learn dispone de una clase con una implementación del algoritmo clásico de construcción de árboles de clasificación y regresión CART, llamada DecisionTreeClassifier (https://scikit-learn.org/stable/modules/tree.html#tree).

Estas implementaciones forman parte del material de base para la implementación final propuesta del algoritmo de consolidación del CART, CTCART.

Una vez llevada a cabo la implementación del algoritmo se realizará una experimentación con un conjunto de problemas de clasificación controlado y los cuatro algoritmos implicados (algoritmos base, C4.5 y CART, y algoritmos de consolidación, CTC o CTC45 y CTCART) para analizar los puntos fuertes y débiles de unos y otros en distintos contextos de clasificación.

Participantes:

Director(es):
Jesús M. Pérez
Universidad:
Universidad del País Vasco/Euskal Herriko Unibertsitatea (UPV/EHU)
Centro:
Informatika Fakultatea - Facultad de Informática
Departamento:
Konputagailuen Arkitektura eta Teknologia - Arquitectura y Tecnología de computadores
Año lectura:
2025