Etiqueta: Generación de datos sintéticos
-
Generación datos Sintéticos en la Industria
El mayor cuello de botella en la implementación industrial del Aprendizaje Automático no es el algoritmo ni la potencia de cálculo: es la paradoja de los datos de fallo. En sectores críticos desde la manufactura avanzada y la energía hasta la automoción, nos enfrentamos a un problema costoso: queremos desarrollar modelos capaces de predecir averías…
-
La topología de tus datos debe dictar tu estrategia de generación sintética
En la era de la IA Generativa, existe una idea equivocada común en la ingeniería de datos: pensar que la generación de datos sintéticos es simplemente una cuestión de «ampliar el Excel». A menudo, ante un dataset desbalanceado o escaso, la tentación es importar una librería estándar, aplicar un algoritmo popular (como SMOTE o una…
-
Generando datos sintéticos realistas con Modelos de Mezclas Gaussianas (GMM)
Uno de los mayores retos en el mantenimiento predictivo del sector aeroespacial es la falta de datos representativos, especialmente de fallos reales (como ya hemos visto en entradas anteriores). En motores de helicópteros o aeronaves, los sistemas de control y supervisión recogen miles de variables en tiempo real, pero casi todos esos registros pertenecen a…
-
Redes Bayesianas para la generación de datos sintéticos
Las redes Bayesianas se basan en las reglas de probabilidad, y mas concretamente en el Teoremas de Bayes: Este teorema nos permite crear estructuras de redes que codifican las relaciones que hay entre las diferentes variables (maravillosas las matemáticas). Esto se representa con nodos (que simbolizan a las variables) y flechas (que simbolizan las relaciones…
-
Procesos Gaussianos para la generación de datos sintéticos
Los procesos Gaussianos son un tipo de modelo estadístico generativo, por lo tanto para cada punto se calcula no solo la predicción de él, si no su distribución (esto significa que cada punto tiene consigo un intervalo de confianza asignado, de valores esperados), son modelos complejos de crear y que requieren un trabajo previo para…
-
ARIMA/SARIMA para la generación de datos sintéticos
Los modelos de AutoRegressive Integrated Moving Average (ARIMA) o Seasonal ARIMA (SARIMA) son modelos que se usan exclusivamente con datos que vienen en forma de series temporales. Están formados por diferentes componentes que se unen para la predicción de los próximos datos en la serie temporal (denominado normalmente forecasting), para entender estos modelos describiremos ahora…
-
Transformers y Mecanismos de Atención
En nuestras publicaciones anteriores, hemos explorado cómo modelos como las Redes Neuronales Recurrentes (RNNs) y sus evoluciones, como las GRUs y LSTMs, nos permitieron trabajar con datos secuenciales, recordando información a lo largo del tiempo. Sin embargo, estas arquitecturas tienen sus limitaciones, especialmente cuando intentamos procesar secuencias muy largas o paralelizar el entrenamiento de estas…
-
Variational Autoencoders para la generacion de datos sintéticos
Los Variational Autoencoders (VAE) son un tipo de autoencoder (o autocodificador), que se usa específicamente para la generación de datos sintéticos. Por lo tanto, es importante entender primero que es un Autoencoder. Los Autoencoders fueron descritos por primera vez formalmente en 1986 [1], aunque fue Kramer en 1991 [2], quien presentó una estructura concreta, y…
-
Kernel Density Estimators para la creación de datos sintéticos
Comenzamos este maravilloso mes de Abril con otro tipo de modelo estadístico generativo, en este caso los Kernel Density Functions. La motivacion de este tipo de algoritmos es ser capaces de describir la función de densidad de una población basándonos unicamente en una muestra limitada de esta. Es importante que entendamos a que nos referimos…
-
LSTM (Long Short-Term Memory)
Ya hemos hablado en nuestras entradas anteriores sobre cómo las Redes Neuronales Recurrentes (RNNs) pueden procesar secuencias y mantener información a través del tiempo. También vimos cómo las GRU simplificaron este proceso con menos parámetros. Hoy profundizaremos en otra arquitectura fundamental: las LSTM (Long Short-Term Memory). Las redes LSTM fueron propuestas en 1997 por Hochreiter…
