IA

Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI

DeepSeek-R1 ofrece un rendimiento muy similar al de o1-preview

Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI
Pedro Domínguez

Pedro Domínguez

  • 21 de noviembre de 2024
  • Actualizado: 2 de diciembre de 2024, 8:45
Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI

El laboratorio chino DeepSeek ha lanzado DeepSeek-R1, uno de los primeros modelos de inteligencia artificial de razonamiento que, según sus creadores, compite con el modelo o1-preview de OpenAI. Este tipo de IA se distingue por su capacidad para “autoverificarse”, ya que invierte más tiempo reflexionando sobre preguntas antes de ofrecer una respuesta. Al igual que el modelo de OpenAI, DeepSeek-R1 sigue un enfoque secuencial para resolver tareas, lo que puede llevar varios segundos dependiendo de la complejidad del problema.

DeepSeek asegura que su modelo alcanza un rendimiento similar al de o1 en pruebas de referencia como AIME y MATH; la primera utiliza otras IA para evaluar el rendimiento, mientras que la segunda incluye problemas matemáticos. Sin embargo, DeepSeek-R1 está lejos de ser perfecto. En redes sociales, algunos usuarios comentaron que el modelo tiene dificultades con juegos de lógica como el tres en raya, un fallo que también se observa en o1. Además, DeepSeek-R1 podría ser fácilmente “jailbreakeado”, lo que, por ejemplo, permitió a un usuario obtener de la IA instrucciones detalladas para fabricar metanfetamina.

Según pudo constatar TechCrunch en sus pruebas, el modelo también bloquea consultas sobre temas políticamente sensibles, como el presidente chino Xi Jinping, la Plaza de Tiananmén o una hipotética invasión de Taiwán. Esta censura reflejaría la influencia del gobierno chino en los proyectos de IA, que deben alinearse con los “valores socialistas” establecidos por las autoridades. El gobierno incluso evalúa las respuestas generadas y propone listas negras de fuentes prohibidas para el entrenamiento de modelos.

El auge de estos modelos de razonamiento llega en un momento en que se cuestionan las “leyes de escalado”, que asumían que más datos y potencia aumentaban continuamente las capacidades de los modelos. Ante la falta de avances significativos en los grandes laboratorios de IA, como OpenAI o Google, se buscan nuevos enfoques, como el “test-time compute”, que otorga más tiempo de procesamiento a los modelos.

DeepSeek planea liberar el código de DeepSeek-R1 y ofrecer una API. La empresa, financiada por el fondo de cobertura High-Flyer Capital Management, ya revolucionó el mercado con modelos previos como DeepSeek-V2. High-Flyer destaca por construir sus propios servidores, como uno con 10.000 GPU Nvidia A100 y un coste de 138 millones de dólares, consolidando así su apuesta por alcanzar una IA “superinteligente”.

ChatGPT DESCARGAR

Últimos artículos

Cargando el siguiente artículo