Etiqueta: Gemelo Digital
-
Redes Neuronales Recurrentes
Hoy vamos a hablar de un tipo de red neuronal fundamental para trabajar con datos de naturaleza secuencial, las Redes Neuronales Recurrentes (RNN). Las RNNs son una clase especial de redes neuronales diseñadas específicamente para procesar datos secuenciales, como texto, audio o series temporales. A diferencia de las redes neuronales convencionales (feed-forward), que procesan cada…
-
Normalizing Flows para la creación de datos sintéticos:
Los Normalizing Flows son un tipo de Probabilistic Generative Model, esto significa que lo que buscamos simular con el modelo es la distribución de una variable X, usando los datos que tenemos (xi), describiéndola con una función de densidad pX(x) y que además es parametrizado por un valor θ. La idea principal de este modelo…
-
Algoritmos genéticos para la creación de datos sintéticos
Continuando con los modelos de generación de datos sintéticos, hoy presentamos los denominados Algoritmos Genéticos. (GA) La idea de estos algoritmos surge en la década de 1960 bajo la mano de John Holland y continuó siendo refinado hasta que en 1975 presento el algoritmo definido en su libro [1]. Con los GA se busca reflejar…
-
Boltzmann Machines para la generación de datos sintéticos
Para esta entrada del blog os pido que saquéis vuestro lado más matemático, ya que para entrar en detalle sobre estas estructuras es necesario explicar las matemáticas que hay detrás. La base de las Boltzmann Machines, son las Hopfield Networks, estas son unas estructuras determinísticas de caracterización de datos. Son simples y están formadas por…
-
Evaluación de datos sintéticos en Series Temporales
La generación de datos sintéticos es una herramienta muy útil, como ya se ha comentado en entradas anteriores del blog. Sin embargo, tenemos que analizar que, en efecto estos datos generados sean representaciones fiables de las características de las series temporales originales, además de introducir suficiente variabilidad a estas. A continuación se muestra técnicas que…
-
Métricas de similitud entre series temporales basadas en alineación (DTW)
A la hora de comparar dos series temporales, la distancia euclídea puede fallar si una de ellas está desfasada o si se mueven a diferentes velocidades. Para resolver este problema se inventó Dynamic Time Warping (DTW), que básicamente busca la mejor forma de “emparejar” los puntos de ambas series, de modo que se minimice la…
-
Hidden Markov Models para la generación sintética de datos.
Los modelos ocultos de Markov (HMM), toman su nombre del matemático ruso Andrey Markov, que desarrolló el concepto de las Cadenas de Markov (Markov Chains). Estas “cadenas” hacen referencia a sistemas en los cuales el siguiente paso depende únicamente del estado actual. Un ejemplo puede ser el juego de la oca, en el cual las…
-
Gaussian Mixture Models para la generación sintética de datos.
Las distribuciones normales o gaussianas están presentes, de una manera u otra, en la mayoría de los modelos estadísticos tradicionales que se usan hoy en día, en los que describimos que los datos provienen de una distribución normal, ya que la naturaleza tiende a seguir esta distribución (lo que llamamos el Teorema del Límite Central)…
-
Modelos de Difusión para la creación sintética de datos
En las entradas previas en el blog hemos estado introduciendo la creación sintética de datos usando modelos basados en datos. Hoy presentamos una técnica diferente, denominada Modelos de difusión. Los modelos de difusión son modelos generativos, que consiguen generar a raíz de ruido datos sintéticos similares a los datos con los que hemos entrenado el…
-
Modelo Physics Based con Simulink
A continuación vamos a ver la implementación de un modelo basado en física (Physic Based), presentados en la entrada Modelos Basados en la Física, mediante la utilización de Simulink con el entorno de Matlab. Ejemplo Physics-Based para un Gemelo Digital de Bomba Hidráulica En este ejemplo, presentamos un modelo de bomba hidráulica desarrollado en Simulink.…