Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI

DeepSeek-R1 ofrece un rendimiento muy similar al de o1-preview

21 de noviembre de 2024
Actualizado: 2 de diciembre de 2024, 8:45

Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI

El laboratorio chino DeepSeek ha lanzado DeepSeek-R1, uno de los primeros modelos de inteligencia artificial de razonamiento que, según sus creadores, compite con el modelo o1-preview de OpenAI. Este tipo de IA se distingue por su capacidad para “autoverificarse”, ya que invierte más tiempo reflexionando sobre preguntas antes de ofrecer una respuesta. Al igual que el modelo de OpenAI, DeepSeek-R1 sigue un enfoque secuencial para resolver tareas, lo que puede llevar varios segundos dependiendo de la complejidad del problema.

Suscríbete a la Newsletter de Softonic y recibe las últimas noticias en tech, juegos, entretenimiento en tu buzón de correo

Suscríbete (es GRATIS) ►

DeepSeek asegura que su modelo alcanza un rendimiento similar al de o1 en pruebas de referencia como AIME y MATH; la primera utiliza otras IA para evaluar el rendimiento, mientras que la segunda incluye problemas matemáticos. Sin embargo, DeepSeek-R1 está lejos de ser perfecto. En redes sociales, algunos usuarios comentaron que el modelo tiene dificultades con juegos de lógica como el tres en raya, un fallo que también se observa en o1. Además, DeepSeek-R1 podría ser fácilmente “jailbreakeado”, lo que, por ejemplo, permitió a un usuario obtener de la IA instrucciones detalladas para fabricar metanfetamina.

Según pudo constatar TechCrunch en sus pruebas, el modelo también bloquea consultas sobre temas políticamente sensibles, como el presidente chino Xi Jinping, la Plaza de Tiananmén o una hipotética invasión de Taiwán. Esta censura reflejaría la influencia del gobierno chino en los proyectos de IA, que deben alinearse con los “valores socialistas” establecidos por las autoridades. El gobierno incluso evalúa las respuestas generadas y propone listas negras de fuentes prohibidas para el entrenamiento de modelos.

El auge de estos modelos de razonamiento llega en un momento en que se cuestionan las “leyes de escalado”, que asumían que más datos y potencia aumentaban continuamente las capacidades de los modelos. Ante la falta de avances significativos en los grandes laboratorios de IA, como OpenAI o Google, se buscan nuevos enfoques, como el “test-time compute”, que otorga más tiempo de procesamiento a los modelos.

DeepSeek planea liberar el código de DeepSeek-R1 y ofrecer una API. La empresa, financiada por el fondo de cobertura High-Flyer Capital Management, ya revolucionó el mercado con modelos previos como DeepSeek-V2. High-Flyer destaca por construir sus propios servidores, como uno con 10.000 GPU Nvidia A100 y un coste de 138 millones de dólares, consolidando así su apuesta por alcanzar una IA “superinteligente”.

ChatGPT DESCARGAR

Pedro Domínguez

Publicista y productor audiovisual enamorado de las redes sociales. Paso más tiempo pensando a qué videojuegos voy a jugar que jugándolos.

Lo último de Pedro Domínguez

Directrices editoriales

También te puede interesar

Ver más artículos

Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI

Lo último de Pedro Domínguez

También te puede interesar

¿El esperado Google Pixel 10 tendrá una pantalla que cuide de todos nosotros?

La oscura serie coreana que lo está petando en Netflix y no tiene nada que envidiar al Juego del Calamar

Surfshark lanza un servicio DNS centrado en la privacidad, el primero de su clase

Google quiere democratizar el aprendizaje vía Podcast

Elon Musk lanza la versión beta de Grok 3.5: ¿es la mejor IA del momento?

Clair Obscur: Expedition 33 no es tan único: 6 juegos que también tienen combates por turnos diferentes

Últimos artículos