El toolbox Statistics and Machine Learning Toolbox de MATLAB ofrece la aplicación Regression Learner, que permite entrenar y evaluar modelos de regresión sin necesidad de programar. Con una interfaz sencilla y visual, facilita tareas como:
- Carga de datos y seleccion de variables relevantes.
- Entrenamiento de modelos como regresión lineal, árboles de decisión, SVM, redes neuronales o modelos de ensamblado.
- Evaluación del rendimiento mediante diferentes métricas.
- Comparación de algoritmos y ajustes de hiperparámetros.
- Exportación del modelo para su integración en aplicaciones.
Esto lo hace una aplicación ideal para usuarios que quieren explorar y validar modelos predictivos de forma rápida y sin escribir código.
Interpretabilidad con EXPLAIN
Al igual que la aplicación analizada anteriormente Classification Learner, MATLAB también incluye un módulo EXPLAIN en Regression Learner para aplicar diferentes técnicas post-hoc de XAI, que permiten entender qué variables afectan a las predicciones del modelo y en qué medida.
Gracias a estas herramientas, es posible analizar las decisiones del modelo de forma global o centrarse en observaciones especificas para entender predicciones individuales. Las técnicas implementadas son las siguientes:
- Shapley Importance: Evalúa qué variables tienen mayor impactro promedio en las predicciones.
- Shapley Summary: Muestra cómo influyen positiva o negativamente los predictores en los resultados.
- Shapley Dependence: Relaciona el valor de un predictor con su efecto sobre la predicción.
- Partial Dependence: Representa el efecto marginal de una variable en la salida del modelo.
- Local Shapley: Explica el motivo de una predicción concreta comprarándola con el promedio.
- LIME: Ajusta un modelo interpretable alrededor de una instancia para entender su predicción.
Estas técnicas permiten tanto la interpretación global del comportamiento del modelo como un análisis local, incluyendo simulaciones What-if que permiten modificar valores de entrada de una observación y analizar el impacto en la poredicción.
La herramienta puede resultar muy interesante para la exploración visual del comportamiento del modelo, especialmente al ser accesible sin necesidad de programar, resultando ideal para proyectos donde se requiera algo de explicabilidad. Sin embargo, esto mismo presenta una limitación en caso de tener la necesidad de implementar otras técnicas.