En entornos industriales reales, obtener conjuntos de datos completamente etiquetados para detección de anomalías suele ser costoso y difícil. El aprendizaje semi-supervisado emerge como solución pragmática, combinando pequeñas cantidades de datos etiquetados con grandes volúmenes de datos no etiquetados para construir modelos robustos de detección de anomalías en mantenimiento predictivo.
Ventajas del Enfoque Semi-supervisado en Contexto Industrial
¿Por qué semi-supervisado en mantenimiento predictivo?
- Costo reducido: Etiquetar todas las anomalías en datos industriales es prohibitivo.
- Adaptabilidad: Permite incorporar fácilmente nuevos datos no etiquetados.
- Robustez: Combina lo mejor de los enfoques supervisados y no supervisados.
- Detección de anomalías novedosas: Puede identificar patrones no vistos en los datos etiquetados.
Este enfoque es particularmente valioso para detectar fallos incipientes en equipos rotativos como turbinas, motores y bombas, donde los patrones de fallo pueden evolucionar con el tiempo.
Técnicas Semi-supervisadas para Detección de Anomalías
1. Autoencoders con Etiquetas Parciales
Los autoencoders pueden ser entrenados principalmente con datos no etiquetados, mientras se utilizan las muestras etiquetadas para ajustar el umbral de detección:
input_dim = X_train.shape[1]
input_layer = Input(shape=(input_dim,))
encoder = Dense(encoding_dim, activation="relu")(input_layer)
decoder = Dense(input_dim, activation='sigmoid')(encoder)
autoencoder = Model(inputs=input_layer, outputs=decoder)
# Fase no supervisada
autoencoder.compile(optimizer='adam', loss='mse')
autoencoder.fit(X_unlabeled, X_unlabeled, epochs=50)
# Fase supervisada (ajuste de umbral)
reconstructions = autoencoder.predict(X_labeled)
errors = np.mean(np.square(X_labeled - reconstructions), axis=1)
threshold = np.percentile(errors, 95) # Usando el 5% de anomalías etiquetadas
2. Aprendizaje por Transferencia de Características
Utiliza un modelo preentrenado con datos etiquetados de un dominio similar, seguido de fine-tuning con datos no etiquetados del dominio específico:
- Fase 1: Entrenar modelo supervisado en datos etiquetados de dominio similar.
- Fase 2: Aplicar el modelo a datos no etiquetados para generar pseudo-etiquetas.
- Fase 3: Entrenamiento final con mezcla de datos etiquetados y pseudo-etiquetados.
3. Modelos de Grafos para Relaciones Complejas
En escenarios donde se conocen relaciones entre componentes (grafos de conocimiento), se pueden propagar etiquetas limitadas a nodos no etiquetados:
Preprocesamiento para Datos Semi-supervisados
El preprocesamiento adecuado es crucial para maximizar la información extraída de los datos no etiquetados:
- Alineamiento temporal: Sincronización precisa de señales multivariadas.
- Normalización contextual: Ajuste basado en condiciones operativas.
- Augmentación de datos: Generación de muestras sintéticas respetando relaciones físicas.
- Selección de características guiada por dominio: Incorporación de conocimiento experto.
Técnicas avanzadas de augmentación para datos industriales
- Modelado físico: Generar datos sintéticos basados en ecuaciones de degradación.
- Perturbaciones controladas: Introducir variaciones dentro de rangos físicamente plausibles.
- Mixup temporal: Combinación lineal de secuencias temporales similares.
Implementación en Sistemas de Mantenimiento Predictivo
La implementación exitosa de modelos semi-supervisados requiere consideraciones específicas:
- Actualización continua: Incorporación iterativa de nuevas etiquetas.
- Mecanismos de retroalimentación: Para validar pseudo-etiquetas con expertos.
- Monitoreo de deriva: Detección de cambios en distribuciones de datos.
- Explicabilidad: Técnicas para interpretar decisiones del modelo.
Un caso de éxito en la industria petrolera demostró que este enfoque puede reducir los falsos positivos en un 40% comparado con métodos puramente no supervisados, manteniendo una tasa de detección del 98%.
Referencias
- Van Engelen, J. E., & Hoos, H. H. (2020). A survey on semi-supervised learning. Machine Learning, 109(2), 373-440.
- Li, X., et al. (2021). Semi-supervised anomaly detection for industrial systems using deep generative models. IEEE Transactions on Industrial Informatics, 17(1), 545-556.
- Zhang, C., et al. (2022). Graph-based semi-supervised learning for industrial anomaly detection. Mechanical Systems and Signal Processing, 163, 108143.