Publicidad

Noticias

¿Volvemos a las andadas? La directora tecnológica de OpenAI afirma no saber con qué datos se ha entrenado Sora

Mira Murati no está segura de si Sora se ha entrenado con datos de redes sociales.

¿Volvemos a las andadas? La directora tecnológica de OpenAI afirma no saber con qué datos se ha entrenado Sora
Pedro Domínguez

Pedro Domínguez

  • Actualizado:

Cada vez que una compañía tecnológica lanza una nueva inteligencia artificial, la primera duda que surge es “¿de dónde vienen los datos con los que se ha entrenado?”. Los modelos de IA se entrenan utilizando grandes conjuntos de datos, que ayudan al modelo a aprender a reconocer patrones, hacer predicciones o entender el lenguaje.

ChatGPT DESCARGAR

Y es que no han sido pocas las IA que se han entrenado con datos obtenidos de forma ilícita o al menos dudosa, incluyendo la popular ChatGPT, de la empresa OpenAI. Por este mismo motivo, resulta cuanto menos sorprendente que la directora tecnológica de esta compañía, Mira Murati, no tenga clara la fuente de los datos utilizados para entrenar a Sora, la nueva IA de la compañía capaz de generar vídeos.

Durante una entrevista con The Wall Street Journal publicada el 13 de marzo, Murati ofreció respuestas cuanto menos vagas cuando se le preguntó por la fuente de los datos del modelo Sora de OpenAI, capaz de generar vídeos a partir de instrucciones de texto. “Utilizamos datos disponibles públicamente y datos con licencia”, respondió Murati sobre cómo estaba entrenando la compañía su próximo modelo.

Joanna Stern, periodista del WSJ, preguntó entonces si Sora se había entrenado con datos de plataformas como YouTube, Instagram o Facebook, a lo que Murati respondió: “No estoy segura de eso”, añadiendo: “Ya sabes, si estaban a disposición del público – a disposición del público a utilizar. Pero no estoy segura. No estoy segura de ello”.

Antes de pasar a otro tema, Stern mencionó la asociación de OpenAI con la empresa de imágenes de archivo Shutterstock, preguntando si sus datos podrían utilizarse para entrenar a Sora. “No voy a entrar en detalles sobre los datos que se utilizaron. Pero eran datos públicos o con licencia”, añadió Murati. Más tarde, la directiva confirmó al WSJ que, efectivamente, se utilizaron datos de Shutterstock para entrenar a Sora.

ChatGPT DESCARGAR
Pedro Domínguez

Pedro Domínguez

Publicista y productor audiovisual enamorado de las redes sociales. Invierto más tiempo pensando en qué videojuegos jugaré que jugando.

Lo último de Pedro Domínguez

Directrices editoriales