Una de las novedades incluidas en DALL-E 3, la tercera versión del generador de imágenes de OpenAI, era la censura total de símbolos polémicos y personajes públicos. Aún así, los usuarios han logrado sortear todas las protecciones y ya hay quienes quienes recrean escenas donde se ven personajes animados sobrevolando las Torres Gemelas.
Es un hecho: ya sabemos que los usuarios de Internet se las saben todas. DALL-E 3 se encuentra integrado en Bing Chat de forma gratuita y muchos ya han empezado a “jugar” con sus capacidades. Sin embargo, las nuevas normas de censura impuestas por OpenAI han servido para que algunos lo sientan como un desafío: ¿cuáles son los límites reales de Bing Chat? ¿Es realmente capaz de evitar generaciones ofensivas? Se ve que no.
Un ejemplo muy llamativo es el de las famosas Torres Gemelas. El bloqueo activo de palabras como “Twin Towers” o “World Trade Center” no ha evitado la creación de escenas que incluyen a Bob Esponja estrellándose contra los edificios, por mencionar una de tantas.
Y es que de bien poco han servido estas medidas a Microsoft. Caitlin Roulston, director de comunicaciones de Microsoft, comunicó a The Verge que la compañía planea mejorar sus sistemas para “ayudar a prevenir la creación de contenido hiriente o sensible […] como con cualquier nueva tecnología, algunos quieren usarla de formas que no estaban previstas. Es por eso que estamos implementando una serie de filtros para que Bing Image Creator sea una experiencia positiva“.
Microsoft tampoco ha entrado en detalle sobre qué tipo de filtros se emplearían o cómo funcionarían estos. Asimismo, estos “bloqueos” son más urgentes que nunca. Usuarios de foros como 4chan ya están publicando guías detalladas sobre cómo sortear la censura en Bing Chat y Stable Diffusion para distribuir imágenes racistas, por ejemplo.
En el caso de OpenAI, ellos mismos admitieron que sus medidas de seguridad estaban lejos de ser “perfectas” y que se encuentran en constante actualización. ¿Veremos lo mismo próximamente con Bing Chat? ¿Mejorarán en un futuro cercano sus herramientas de detección?