El pasado martes, Stability AI lanzó Stable Diffusion XL Turbo (SDXL Turbo), su último modelo de IA generativa. Al igual que Midjourney o DALL-E, esta herramienta es capaz de crear imágenes a partir de texto. Sin embargo, SDXL Turbo destaca por una característica muy especial: es capaz de generar imágenes “en tiempo real“.
La revolucionaria habilidad de SDXL Turbo para generar imágenes en un único paso representa un gran avance frente a su competencia y a si mismo. Ya no es necesario esperar: SDXL Turbo va transformando el resultado de la generación a medida que vamos escribiendo el prompt.
Esta eficiencia se debe a la inclusión de nueva técnica llamada Adversarial Diffusion Distillation (ADD). El ADD mejora el aprendizaje del modelo a partir de otros sistemas de síntesis de imágenes y refina su capacidad para distinguir entre lo real y lo artificial. Como resultado, también mejora el realismo de las imágenes generadas.
En lo que más destaca SDXL Turbo es en su rapidez. Según Stability AI, gracias al uso de la NVIDIA A100 (una tarjeta gráfica diseñada para la inteligencia artificial), SDXL Turbo puede crear una imagen de 512×512 píxeles en solo 207 milisegundos. Este tiempo incluye todo el proceso completo: codificación, eliminación de ruido y decodificación.
La velocidad de SDXL Turbo abre nuevas posibilidades, como la creación de filtros de vídeo impulsados por IA en tiempo real o incluso el desarrollo de gráficos avanzados para videojuegos. Sin embargo, para que estas aplicaciones sean viables sigue siendo necesario resolver desafíos como la coherencia. Cuando hablamos de coherencia, nos referimos a mantener una uniformidad entre diferentes fotogramas o generaciones de imágenes para evitar deformaciones.
Si quieres saber más, Stability AI ha publicado en su propia web un detallado artículo donde explica el funcionamiento de ADD y SDXL Turbo.