Publicidad

Noticias

¿Puede ChatGPT ver nuestras imágenes y oír nuestra voz? Sí y pronto lo vamos a descubrir

Las nuevas posibilidades de ChatGPT son una auténtica locura

¿Puede ChatGPT ver nuestras imágenes y oír nuestra voz? Sí y pronto lo vamos a descubrir
Chema Carvajal Sarabia

Chema Carvajal Sarabia

  • Actualizado:

Para todos los que usan ChatGPT a diario, la revolución que está a punto de llegar a la herramienta suena a bendición. Para los que temen a la inteligencia artificial, esto es un paso más en la supremacía de la IA.

ChatGPT DESCARGAR

OpenAI, creadores de ChatGPT, ha anunciado que estaba empezando a implementar el reconocimiento de voz e imágenes en ChatGPT. En pocas palabras, la IA puede reconocer una imagen por lo que es y comunicarse con los usuarios sobre ella.

Además, la IA tiene ahora capacidades de sintetización de voz a texto y de texto a voz. Se supone que todas estas nuevas funciones harán que el chatbot parezca más “humano” que en versiones anteriores.

Cómo funciona el nuevo ChatGPT

OpenAI ha compartido un vídeo promocional para que los usuarios se hagan una idea de cómo serán las funciones de reconocimiento de imágenes.

En él, un usuario pide a ChatGPT que le ayude a bajar el sillín de su bicicleta, a lo que el chatbot responde con algunos consejos generales (y, si no fuéramos caritativos, extremadamente obvios) para bajar cualquier tipo de sillín.

A continuación, el usuario dibujó un círculo alrededor del enganche del sillín de la bici y pidió ayuda más detallada, para lo cual ChatGPT supuestamente reconoció el tipo de tornillo e indicó al usuario que necesitaba una llave Allen.

Supuestamente, el sistema también es capaz de ver una foto del manual del usuario y de la caja de herramientas para comprobar si tiene la llave del tamaño adecuado.

Aunque el reconocimiento de imágenes no es algo con lo que hayan experimentado muchos servicios de chatbot, estamos muy al día de los sistemas de reconocimiento de voz, así como de la sintetización de voz.

OpenAI presentó los nuevos servicios de voz del chatbot con un vídeo de una madre que pide a ChatGPT que lea a sus hijos un cuento para dormir sobre un erizo del bosque (podría leerles un libro ilustrado, pero supongo que es una forma de ser padre).

Las muestras incluidas en la entrada del blog de OpenAI tienen una cadencia de sonido natural, aunque no es que los paquetes de voz “Juniper”, “Sky” o “Breeze” vayan a crear voces únicas para el pequeño erizo Larry o cualquiera de sus amigos del bosque. Cada voz se basa en un actor de doblaje que cedió sus sonidos al sistema bajo licencia, según OpenAI.

Por supuesto, la nueva función sólo está disponible para los usuarios que pagan por el servicio Plus o Enterprise, y ambas capacidades deberían estar disponibles en iOS y Android en las próximas dos semanas.

Los usuarios de la versión web de ChatGPT también dispondrán pronto de las funciones de imagen. El sistema tampoco será tan rápido ni tan capaz como sugieren los vídeos promocionales.

Wired informó, basándose en una versión preliminar, que el reconocimiento de voz tardaba varios segundos en responder, y que el sistema de imagen no intentará identificar a las personas en las fotos (bastantes dudas sobre la protección de datos y la privacidad de las personas).

ChatGPT DESCARGAR
Chema Carvajal Sarabia

Chema Carvajal Sarabia

Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.

Lo último de Chema Carvajal Sarabia

Directrices editoriales