Arte Asistido por AI
La tecnología detrás de las imágenes producidas por AI se llama modelos de difusión. Estos modelos son un tipo de AI generativo, lo que significa que pueden generar puntos de datos que son similares a los puntos de datos en los que han sido entrenados (el conjunto de entrenamiento). Entonces, cuando le pedimos a estos modelos que produzcan una imagen, comienza a probar imágenes que son similares a los miles de millones de imágenes de Internet en las que se entrenó. Es importante tener en cuenta que no copia simplemente una imagen del conjunto de entrenamiento, sino que crea una nueva imagen que es similar al conjunto de entrenamiento.
La idea principal detrás de cómo sucede esto es la siguiente: si se toma cualquier imagen de su conjunto de entrenamiento y se agrega una pequeña cantidad de ruido estático aleatorio, creará una nueva imagen que es un poco menos probable que sea vista en el conjunto de entrenamiento. Por lo tanto, se puede tomar cualquier imagen de su conjunto de entrenamiento y, paso a paso, agregarle niveles crecientes de ruido aleatorio y generar versiones cada vez más ruidosas de esa imagen, con menos probabilidades de encontrarse en el conjunto de entrenamiento.
Este proceso de "ruido" nos permite tomar imágenes del conjunto de entrenamiento y agregarles cantidades conocidas de ruido hasta que se convierta en un ruido completamente aleatorio. Este proceso toma imágenes de un estado de alta probabilidad de ser encontrado en el conjunto de entrenamiento a tener una baja probabilidad de existir en el conjunto de entrenamiento.
Ahora, si tomamos este modelo de difusión entrenado y simplemente le damos una imagen estática aleatoria y ejecutamos el proceso de eliminación de ruido, transformará la imagen estática en una imagen que se parece a las imágenes en el conjunto de entrenamiento.
Las tres aplicaciones con el mayor uso de los modelos de difusión generativa para arte con AI son: DALL-E de OpenAI, Stable Diffusion (SD) de StabilityAI y Midjourney. El breve vídeo en la parte superior de esta página, así como las diversas imágenes que se muestran a continuación, han sido producidas por estas aplicaciones (mover el ratón encima de la imagen y hacer "click" en el signo + para agrandar). Primeras 4 imágenes DALL-E, siguientes 4 SD y las últimas 8 Midjourney.