
DeepSeek R1
DeepSeek vuelve a dejar en ridículo a ChatGPT al actualizar R1: su IA rinde como OpenAI o3 y ya razona profundamente
No ha llegado ni a las 24 horas desde que estuviera disponible y ya se han consumido más de 500 millones de tokens del nuevo DeepSeek R1-0528.
Más información: OpenAI va a por DeepSeek y al fin hará honor a su nombre: va a lanzar su primer modelo de IA "Open Source" desde GPT-2
DeepSeek no solo desató la locura entre los usuarios y las compañías que cuentan con modelos de IA por ser open source, sino por su eficiencia para que se pueda instalar incluso de forma local en un móvil. Ahora la startup china ha actualizado el modelo de razonamiento DeepSeek R1.
Otra de las mayores virtudes de DeepSeek R1, aparte de ser totalmente gratuito sin límites para los usuarios, es que muestra su lógica de pensamiento para razonar las respuestas del usuario. Esta experiencia ya se puede disfrutar también en ChatGPT al igual que en Gemini.
Ahora la startup china pega un gran salto hacia delante al publicar una versión actualizada de su modelo de razonamiento de IA R1 en la plataforma para desarrolladores Hugging Face al anunciarlo desde WeChat hace unas horas.
Es una actualización menor según clama DeepSeek en el anuncio en WeChat, y llega bajo una licencia MIT permisiva. Lo que significa que puede ser usado comercialmente sin límites como otra de las características que abrió multitud de posibilidades cuando llegó en enero.
En el repositorio de Hugging Face no aparece ninguna descripción del modelo, según TechCrunch, y se queda solo en los archivos de configuración y los componentes internos de un modelo que guía su comportamiento, pero en Reddit ya se han compartido algunas de sus mejores capacidades, que no son pocas.

Los modelos de IA de mayor rendimiento desde LiveCodeBench
DeepSeek R1-0528 ya razona profundamente como los modelos de Google, se ha mejorado su capacidad para la escritura creativa para ser más natural y con mejor formato, y ahora utiliza un estilo de razonamiento distinto centrado en ser más reflexivo que rápido.
Hay otro punto importante en la actualización de DeepSeek R1: es capaz de generar sesiones de pensamiento profundo de mayor extensión para llegar hasta los 30 - 60 minutos, así que las consultas incluso podrán ser más complejas.
En cuanto al rendimiento, el nuevo DeepSeek R1-0528 rinde a la par que OpenAI o3 según LiveCodeBench, el modelo más avanzado de ChatGPT que fue lanzado el mes pasado. Así que se convierte de nuevo en un desafío total para los intereses de OpenAI con su ChatGPT.
Por lo que respecta a su disponibilidad, el nuevo modelo actualizado DeepSeek R1-0528 se puede probar ya en las apps para móviles y en la web oficial, así que se puede acceder para recibir respuestas que ahora pueden sobrepasar más de 2.000 palabras (antes se quedaba en las mil).
Para poder instalarlo de forma local, según recoge unsloth, estaría disponible su descarga en las próximas 24 horas. Esta ha sido otra de sus mejores capacidades, poder instalarlo en un PC siempre que se cuente con una tarjeta RTX de las series 30xx, 40xx o las últimas 50xx (aunque no es del todo esencial para hacerlo funcionar).
Desde que fue actualizado DeepSeek R1, ya se han consumido más de 500 millones de tokens, una cifra muy alta para un modelo de IA que no lleva ni las 24 horas disponible. Ser open source, sin límites, que opere como Gemini y alcance a o3 vuelve a dejar claro la capacidad de la startup china.
Todavía se está a la espera de que lance DeepSeek R2, que sí sería un paso mayor en capacidades y rendimiento. Se suponía que sería el mes pasado cuando llegaría la nueva versión, pero parece que habrá que esperar y disfrutar de esta nueva actualización que pone otra vez contra las cuerdas a ChatGPT de OpenAI.