Publicidad

Noticias

¿Te acuerdas de la IA que imita las voces de los famosos? Va a usarla Spotify para doblar los podcast

Deseando escuchar a Joe Rogan en catalán

¿Te acuerdas de la IA que imita las voces de los famosos? Va a usarla Spotify para doblar los podcast
Chema Carvajal Sarabia

Chema Carvajal Sarabia

  • Actualizado:

Spotify está probando una nueva función basada en IA que hará que puedas escuchar cualquier podcast del mundo en español o inglés, pese a que los presentadores sean chinos o árabes.

Spotify DESCARGAR

La Traducción de voz es una nueva función que se pone en marcha hoy (25 de septiembre) y que te permitirá escuchar determinados episodios de pódcast en un idioma diferente, pero con la propia voz del locutor… Sí, esto te suena de otra cosa.

La herramienta, desarrollada por Spotify con la ayuda del sistema de reconocimiento automático del habla (ASR) Whisper de OpenAI, utiliza un modelo generativo de IA de voz a texto para traducir los archivos de audio y un modelo de réplica de voz para igualar el estilo del locutor original.

Spotify comenzará con los podcast propios

Entre los primeros presentadores que formarán parte de esta nueva función se encuentran Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons y Steven Bartlett. Es decir, los programas grandes e importantes del servicio verde.

Sin embargo, no todos los episodios de sus respectivos podcasts estarán disponibles en varios idiomas de inmediato. En cambio, no pierdas de vista el episodio “Entrevista con Yuval Noah Harari” en el podcast de Lex Fridman, “Kristen Bell, por la gracia de Dios, vuelve” en Armchair Expert, y “Entrevista con la Dra. Mindy Pelz” en The Diary of a CEO with Steven Bartlett, que ya están disponibles en español.

Spotify afirma que habrá más episodios disponibles en los próximos días y semanas, con traducciones al francés y al alemán. Podrás encontrarlos en la vista Ahora suena de tu aplicación móvil o de escritorio, y se añadirán más episodios traducidos por voz a un centro dedicado a las traducciones de voz.

Ahora la IA sí que va a ser diferencial

Los mejores servicios de streaming de música se apresuraron a subirse a la fiebre del oro de la IA generativa tras el revuelo causado por ChatGPT de OpenAI.

Aunque ya utilizaban el aprendizaje automático para identificar patrones y tendencias en los hábitos de escucha musical y recomendar mejor nuevas canciones (por ejemplo, la lista de reproducción Descubrimiento Semanal), se han introducido nuevas formas de utilizar esta tecnología.

El AI DJ de Spotify, que utiliza una voz generada por inteligencia artificial para recomendar nuevas canciones, es una de ellas. También está el acuerdo de Universal Music con Endel para crear sonidos ambientales como ruidos del bosque y agua corriente utilizando IA, así como innumerables generadores de música, incluidos los de Meta y Google.

Pero, sin duda, lo que más miedo daba era la idea de utilizar IA generativa para crear pódcast desde cero. Varios pódcast de IA generativa surgieron a raíz de la experimentación en este campo, entre ellos The Joe Rogan AI Experience y Hackers News Recap, por nombrar un par.

Y si bien lo de cread podcast con IA es terrorífico, esto de usar la IA generativa para traducir los pódcast es el tipo de uso que cualquiera apoyaría, ya que los vuelve más accesibles a todos los oyentes, sin importar el idioma que hablemos.

Spotify DESCARGAR
Chema Carvajal Sarabia

Chema Carvajal Sarabia

Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.

Lo último de Chema Carvajal Sarabia

Directrices editoriales