Publicidad

Noticias

Apple presenta una nueva IA para modificar imágenes: nadie parece darse cuenta, pero es así de impresionante

Modificaciones precisas con solo pedírselo a Siri, por ejemplo.

Apple presenta una nueva IA para modificar imágenes: nadie parece darse cuenta, pero es así de impresionante
David Bernal Raspall

David Bernal Raspall

  • Actualizado:

En un momento donde la inteligencia artificial (IA) se ha convertido en un pilar fundamental para el avance tecnológico, Apple ha dado otro paso adelante al presentar una innovación que, aunque no ha acaparado los titulares de manera masiva, promete revolucionar la forma en que interactuamos con nuestras imágenes. Se trata de “MGIE” (Edición de Imágenes Guiada por MLLM), un modelo de IA de código abierto capaz de editar imágenes basándose en instrucciones en lenguaje natural. Una herramienta, desarrollada en colaboración con investigadores de la Universidad de California, que representa un avance muy significativo en el campo de la edición de imágenes, al permitir manipulaciones a nivel de píxel a partir de nuestras solicitudes.

iOS 17 Descargar

“Oye Siri, haz que en esta foto el cielo esté despejado y añade un árbol de navidad junto a la casa”

Apple ha presentado ya varios modelos de IA propios, sin que llamen demasiado la atención. Y no por su calidad, sino por su escasa promoción y su publicación casi exclusiva en medios académicos. Nuevos modelos que, si los rumores son ciertos, llegarán con iOS 18 y pueden cambiar notablemente el panorama de las inteligencias artificiales.

En esta ocasión, MGIE utiliza modelos de lenguaje grande multimodal (MLLMs) para interpretar las peticiones que le hacemos y ejecutar una amplia gama de ediciones, desde mejoras fotográficas globales como ajustes de brillo, contraste o nitidez, hasta la aplicación de efectos artísticos como el dibujo a mano. Además, permite la edición local que puede modificar la forma, tamaño, color o textura de regiones u objetos específicos en la imagen, e incluso realizar modificaciones al estilo Photoshop, como recortar, redimensionar, rotar, añadir filtros, cambiar fondos y fusionar imágenes.

Una solicitud tan simple como pedir que se añadan unos relámpagos a una foto de un paisaje da unos resultados realmente asombrosos. Lo mismo si le pedimos que convierta una foto de unos donuts de chocolate a donuts de fresa. Tal como podemos ver en los ejemplos encima de estas líneas, la herramienta puede llevar a cabo optimizaciones globales, como “añadir contraste para simular más luz”, o modificaciones al estilo Photoshop, como eliminar personas del fondo de una foto para centrar la atención en la expresión facial del sujeto.

Tras la presentación de MGIE en la Conferencia Internacional sobre Representaciones de Aprendizaje, el modelo ya está disponible en GitHub, incluyendo el código, los datos y los modelos preentrenados, por lo que ya podemos probar el sistema si disponemos del equipo necesario para ello.

Este lanzamiento marca el segundo gran avance de Apple en la investigación de IA en tan solo unos meses, siguiendo el desarrollo de nuevas técnicas para desplegar modelos de lenguaje grande (LLMs) en los iPhone y otros dispositivos Apple con ciertas especificaciones de memoria RAM.

iOS 17 Descargar

A pesar de que estos avances no han captado la atención mediática en la medida que otros lanzamientos tecnológicos, el impacto potencial de MGIE, además de las pistas que nos da de los proyectos de IA por parte de la compañía, es algo muy reseñable. La capacidad de editar imágenes de manera intuitiva y precisa, junto con la integración de IA generativa en nuestros dispositivos, probablemente con iOS 18, sin duda marcará un antes y un después.

David Bernal Raspall

David Bernal Raspall

Arquitecto | Creador de hanaringo.com | Formador en tecnologías Apple | Redactor en Softonic y iDoo_tech y anteriormente en Applesfera

Lo último de David Bernal Raspall

Directrices editoriales