Etiqueta: Gemelo Digital

  • Agent Based Models para la generacion de datos sintéticos

    Hace una temporada os enseñamos la diferencia entre modelos basados en datos y modelos basados en física. El trabajo que os hemos ido presentado en el área de Gemelo Digital se ha centrado siempre mas en modelos basados en datos, por las complicaciones que los modelos basados en física traían, hoy sin embargo queremos refrescar…

  • Variational Autoencoders para la generacion de datos sintéticos 

    Los Variational Autoencoders (VAE) son un tipo de autoencoder (o autocodificador), que se usa específicamente para la generación de datos sintéticos. Por lo tanto, es importante entender primero que es un Autoencoder.  Los Autoencoders fueron descritos por primera vez formalmente en 1986 [1], aunque fue Kramer en 1991 [2], quien presentó una estructura concreta, y…

  • Kernel Density Estimators para la creación de datos sintéticos

    Comenzamos este maravilloso mes de Abril con otro tipo de modelo estadístico generativo, en este caso los Kernel Density Functions. La motivacion de este tipo de algoritmos es ser capaces de describir la función de densidad de una población basándonos unicamente en una muestra limitada de esta. Es importante que entendamos a que nos referimos…

  • LSTM (Long Short-Term Memory)

    Ya hemos hablado en nuestras entradas anteriores sobre cómo las Redes Neuronales Recurrentes (RNNs) pueden procesar secuencias y mantener información a través del tiempo. También vimos cómo las GRU simplificaron este proceso con menos parámetros. Hoy profundizaremos en otra arquitectura fundamental: las LSTM (Long Short-Term Memory). Las redes LSTM fueron propuestas en 1997 por Hochreiter…

  • GRU (Gated Recurrent Units)

    En nuestra entrada anterior hablamos de las Redes Neuronales Recurrentes (RNNs), las cuales eran capaces de recordar información a través del tiempo gracias a un estado oculto. Sin embargo, también vimos que entrenarlas tiene algunas complicaciones como el problema del gradiente evanescente o explosivo. Para superar estos retos, los investigadores desarrollaron arquitecturas más avanzadas, y…

  • Redes Neuronales Recurrentes

    Hoy vamos a hablar de un tipo de red neuronal fundamental para trabajar con datos de naturaleza secuencial, las Redes Neuronales Recurrentes (RNN). Las RNNs son una clase especial de redes neuronales diseñadas específicamente para procesar datos secuenciales, como texto, audio o series temporales. A diferencia de las redes neuronales convencionales (feed-forward), que procesan cada…

  • Normalizing Flows para la creación de datos sintéticos:

    Los Normalizing Flows son un tipo de Probabilistic Generative Model, esto significa que lo que buscamos simular con el modelo es la distribución de una variable X, usando los datos que tenemos (xi), describiéndola con una función de densidad pX(x) y que además es parametrizado por un valor θ. La idea principal de este modelo…

  • Algoritmos genéticos para la creación de datos sintéticos

    Continuando con los modelos de generación de datos sintéticos, hoy presentamos los denominados Algoritmos Genéticos. (GA) La idea de estos algoritmos surge en la década de 1960 bajo la mano de John Holland y continuó siendo refinado hasta que en 1975 presento el algoritmo definido en su libro [1]. Con los GA se busca reflejar…

  • Boltzmann Machines para la generación de datos sintéticos

    Para esta entrada del blog os pido que saquéis vuestro lado más matemático, ya que para entrar en detalle sobre estas estructuras es necesario explicar las matemáticas que hay detrás. La base de las Boltzmann Machines, son las Hopfield Networks, estas son unas estructuras determinísticas de caracterización de datos. Son simples y están formadas por…

  • Evaluación de datos sintéticos en Series Temporales

    La generación de datos sintéticos es una herramienta muy útil, como ya se ha comentado en entradas anteriores del blog. Sin embargo, tenemos que analizar que, en efecto estos datos generados sean representaciones fiables de las características de las series temporales originales, además de introducir suficiente variabilidad a estas. A continuación se muestra técnicas que…