Un laboratorio chino presenta un modelo de IA de razonamiento capaz de competir con OpenAI
DeepSeek-R1 ofrece un rendimiento muy similar al de o1-preview


- 21 de noviembre de 2024
- Actualizado: 2 de diciembre de 2024, 8:45

El laboratorio chino DeepSeek ha lanzado DeepSeek-R1, uno de los primeros modelos de inteligencia artificial de razonamiento que, según sus creadores, compite con el modelo o1-preview de OpenAI. Este tipo de IA se distingue por su capacidad para “autoverificarse”, ya que invierte más tiempo reflexionando sobre preguntas antes de ofrecer una respuesta. Al igual que el modelo de OpenAI, DeepSeek-R1 sigue un enfoque secuencial para resolver tareas, lo que puede llevar varios segundos dependiendo de la complejidad del problema.

Suscríbete a la Newsletter de Softonic y recibe las últimas noticias en tech, juegos, entretenimiento en tu buzón de correo
Suscríbete (es GRATIS) ►DeepSeek asegura que su modelo alcanza un rendimiento similar al de o1 en pruebas de referencia como AIME y MATH; la primera utiliza otras IA para evaluar el rendimiento, mientras que la segunda incluye problemas matemáticos. Sin embargo, DeepSeek-R1 está lejos de ser perfecto. En redes sociales, algunos usuarios comentaron que el modelo tiene dificultades con juegos de lógica como el tres en raya, un fallo que también se observa en o1. Además, DeepSeek-R1 podría ser fácilmente “jailbreakeado”, lo que, por ejemplo, permitió a un usuario obtener de la IA instrucciones detalladas para fabricar metanfetamina.
Según pudo constatar TechCrunch en sus pruebas, el modelo también bloquea consultas sobre temas políticamente sensibles, como el presidente chino Xi Jinping, la Plaza de Tiananmén o una hipotética invasión de Taiwán. Esta censura reflejaría la influencia del gobierno chino en los proyectos de IA, que deben alinearse con los “valores socialistas” establecidos por las autoridades. El gobierno incluso evalúa las respuestas generadas y propone listas negras de fuentes prohibidas para el entrenamiento de modelos.

El auge de estos modelos de razonamiento llega en un momento en que se cuestionan las “leyes de escalado”, que asumían que más datos y potencia aumentaban continuamente las capacidades de los modelos. Ante la falta de avances significativos en los grandes laboratorios de IA, como OpenAI o Google, se buscan nuevos enfoques, como el “test-time compute”, que otorga más tiempo de procesamiento a los modelos.
DeepSeek planea liberar el código de DeepSeek-R1 y ofrecer una API. La empresa, financiada por el fondo de cobertura High-Flyer Capital Management, ya revolucionó el mercado con modelos previos como DeepSeek-V2. High-Flyer destaca por construir sus propios servidores, como uno con 10.000 GPU Nvidia A100 y un coste de 138 millones de dólares, consolidando así su apuesta por alcanzar una IA “superinteligente”.

Publicista y productor audiovisual enamorado de las redes sociales. Paso más tiempo pensando a qué videojuegos voy a jugar que jugándolos.
Lo último de Pedro Domínguez
- Google quiere hacer más inteligente tu hogar gracias a estas nuevas funciones
- La última y brillante estrategia de Elon Musk para atraer anunciantes a Twitter es… ¿demandarlos?
- Nvidia lanza una nueva actualización de su nueva “app todo en 1” repleta de mejoras
- Posiblemente estemos (aún) más solos en el universo de lo que pensábamos
También te puede interesar
¿El esperado Google Pixel 10 tendrá una pantalla que cuide de todos nosotros?
Leer más
La oscura serie coreana que lo está petando en Netflix y no tiene nada que envidiar al Juego del Calamar
Leer más
Surfshark lanza un servicio DNS centrado en la privacidad, el primero de su clase
Leer más
Google quiere democratizar el aprendizaje vía Podcast
Leer más
Elon Musk lanza la versión beta de Grok 3.5: ¿es la mejor IA del momento?
Leer más
Clair Obscur: Expedition 33 no es tan único: 6 juegos que también tienen combates por turnos diferentes
Leer más