Etiqueta: Generación de datos sintéticos
-
Algoritmos genéticos para la creación de datos sintéticos
Continuando con los modelos de generación de datos sintéticos, hoy presentamos los denominados Algoritmos Genéticos. (GA) La idea de estos algoritmos surge en la década de 1960 bajo la mano de John Holland y continuó siendo refinado hasta que en 1975 presento el algoritmo definido en su libro [1]. Con los GA se busca reflejar…
-
Boltzmann Machines para la generación de datos sintéticos
Para esta entrada del blog os pido que saquéis vuestro lado más matemático, ya que para entrar en detalle sobre estas estructuras es necesario explicar las matemáticas que hay detrás. La base de las Boltzmann Machines, son las Hopfield Networks, estas son unas estructuras determinísticas de caracterización de datos. Son simples y están formadas por…
-
Evaluación de datos sintéticos en Series Temporales
La generación de datos sintéticos es una herramienta muy útil, como ya se ha comentado en entradas anteriores del blog. Sin embargo, tenemos que analizar que, en efecto estos datos generados sean representaciones fiables de las características de las series temporales originales, además de introducir suficiente variabilidad a estas. A continuación se muestra técnicas que…
-
Métricas de similitud entre series temporales basadas en alineación (DTW)
A la hora de comparar dos series temporales, la distancia euclídea puede fallar si una de ellas está desfasada o si se mueven a diferentes velocidades. Para resolver este problema se inventó Dynamic Time Warping (DTW), que básicamente busca la mejor forma de “emparejar” los puntos de ambas series, de modo que se minimice la…
-
Modelos de Difusión para la creación sintética de datos
En las entradas previas en el blog hemos estado introduciendo la creación sintética de datos usando modelos basados en datos. Hoy presentamos una técnica diferente, denominada Modelos de difusión. Los modelos de difusión son modelos generativos, que consiguen generar a raíz de ruido datos sintéticos similares a los datos con los que hemos entrenado el…