Publicidad

Noticias

Más potente que GPT-4 y offline: el futuro de Siri con iOS 18 se deja ver en este paper

Una investigación muy prometedora.

Más potente que GPT-4 y offline: el futuro de Siri con iOS 18 se deja ver en este paper
David Bernal Raspall

David Bernal Raspall

  • Actualizado:

El lanzamiento del último paper de Apple, titulado “ReALM: Reference Resolution As Language Modeling”, nos promete un avance muy significativo en la capacidad de los asistentes de voz para entender y actuar sobre referencias complejas en las conversaciones que mantenemos con ellos. A lo largo del documento, los investigadores nos dejan entrever cómo Siri podría convertirse en un asistente mucho más inteligente y útil en iOS 18, y cómo podría hacerlo gracias a que el nuevo modelo de Apple podría superar a la última versión de ChatGPT de OpenAI, la GPT-4, en varios aspectos.

iOS 17 Descargar

Un modelo para hacer a Siri mucho más consciente del contexto

Ya sabemos que iOS 18 será la actualización de la IA, lo sabemos por las declaraciones de Tim Cook y hasta por el juego de palabras escondido en las invitaciones a la WWDC 2024. En este contexto, Siri se está preparando para sacar partido a sus nuevas habilidades.

El documento describe un sistema que permite a Siri comprender tres tipos de entidades: las que aparecen en pantalla, las relevantes para la conversación y las que provienen de procesos en segundo plano. Esta capacidad trasciende la simple identificación de lo que se muestra en una imagen, permitiendo a Siri comprender el contexto de la conversación y actuar en consecuencia.

En un ejemplo, podríamos decir algo como “cuando termine la película recuérdame llamar a mamá” y que Siri fuera capaz de responder adecuadamente a la petición. Es un gran paso hacia un asistente que puede manejar consultas mucho más complejas y hacerlo, como siempre, en tiempo real, ofreciendo respuestas y acciones precisas que reflejen tanto el contexto actual del dispositivo como el historial de nuestra interacción con el asistente.

Si seguimos avanzando en el texto publicado por Apple, el paper revela que los investigadores han logrado estos avances utilizando modelos bastante más pequeños que los de GPT-4, lo que sugiere una eficiencia significativa que podría ser crucial para implementar estas capacidades directamente en nuestros dispositivos, sin depender de conexiones a la nube. Un enfoque que mejora la privacidad y seguridad de nuestros datos y que nos asegura que Siri pueda ofrecer ayuda de forma totalmente instantánea, y que pueda hacerlo incluso cuando no hay conexión a internet.

El modelo propuesto por Apple ha demostrado, según el paper ser especialmente competente en tareas de resolución de referencias, superando a sistemas anteriores y mostrando resultados comparables e incluso superiores a los de GPT-4 en determinados escenarios. Según los investigadores, este éxito se atribuye a la capacidad del modelo para entender y utilizar el contexto de manera efectiva, una habilidad crítica para los asistentes de voz —que no tanto para modelos como el de ChatGPT— que necesitan ofrecernos una experiencia natural y fluida con lo que estamos haciendo.

¿Veremos esta investigación convertida en novedades?

Lo cierto es que el paper llega en un excelente momento y con una pieza clave del puzzle que estamos viendo construirse en torno a iOS 18. La idea de un asistente capaz de entender interacciones conversacionales complejas y contextuales, todo mientras opera de manera eficiente y segura y privada en el dispositivo, puede revolucionar la forma en que interactuamos con Siri.

Queda por ver, claro está, cómo se implementarán estas capacidades en los diferentes dispositivos de Apple. Lo cierto es que el modelo que describe este paper es realmente interesante, pero plantea una duda: ¿a qué dispositivos llegará? Por una parte, sabemos que el chip de los iPhone 16 estará especialmente dedicado a la IA, por lo que algunas de las novedades pueden ser exclusivas de los nuevos modelos de iPhone.

Por otra parte, viendo que este es un modelo de ejecución en local, especialmente dado que el contexto de uso del dispositivo es algo que requiere un alto grado de protección, no parece que esta novedad pueda llegar a dispositivos como el Apple Watch, por ejemplo. Y, por contra, podría ser más capaz y complejo en el Mac, con su mayor potencia de cálculo y más cantidad de memoria.

iOS 17 Descargar

En todo caso, el reciente paper de Apple no solo demuestra el potencial de Siri para superar a ChatGPT en tareas específicas, sino que también señala un futuro emocionante para los asistentes de voz. Con capacidades mejoradas de resolución de referencias y la posibilidad de hacerlo off-line, Siri está listo para convertirse en un asistente más útil, más inteligente y más accesible. Y este es solo el comienzo de lo que promete ser una evolución significativa en la forma en que interactuamos con nuestros dispositivos.

David Bernal Raspall

David Bernal Raspall

Arquitecto | Creador de hanaringo.com | Formador en tecnologías Apple | Redactor en Softonic y iDoo_tech y anteriormente en Applesfera

Lo último de David Bernal Raspall

Directrices editoriales