El 20 de enero de 2025, la startup china DeepSeek presentó al mundo su modelo de inteligencia artificial, DeepSeek-R1, marcando un avance significativo en el campo de la IA. Este modelo, ahora disponible bajo la licencia MIT, se puede acceder a través del sitio web oficial de DeepSeek, su aplicación y una API, ofreciendo a la comunidad una herramienta poderosa y versátil.

DeepSeek-R1 ha demostrado un rendimiento comparable al modelo o1 de OpenAI en áreas clave como matemáticas, programación y razonamiento. Este logro se debe en gran medida a la implementación de técnicas avanzadas de aprendizaje por refuerzo a gran escala durante su post-entrenamiento. Esta metodología permitió mejorar el modelo de manera significativa utilizando una cantidad mínima de datos etiquetados, un enfoque eficiente e innovador en el desarrollo de modelos de IA.

Con el objetivo de fomentar la investigación y el desarrollo en el ecosistema global de IA, DeepSeek ha lanzado seis modelos derivados de DeepSeek-R1, con tamaños de 32B y 70B parámetros. Estas versiones, que ofrecen un rendimiento similar al modelo o1-mini de OpenAI, están disponibles en la popular plataforma Hugging Face, facilitando el acceso a desarrolladores, investigadores y organizaciones interesadas en explorar sus capacidades.

La decisión de liberar DeepSeek-R1 bajo una licencia MIT representa un compromiso audaz con la transparencia y la colaboración. Esta apertura permite a la comunidad:

Utilizar los pesos y salidas del modelo para tareas de ajuste fino.

Implementar técnicas de destilación y personalización para diversas aplicaciones.

Con esta estrategia, DeepSeek no solo está promoviendo la innovación, sino también incentivando la adaptación de su tecnología en una amplia gama de contextos.

La introducción de DeepSeek-R1 también refleja una tendencia creciente entre las startups chinas de IA, que están cerrando rápidamente la brecha tecnológica con sus contrapartes estadounidenses. Este avance desafía la idea de que los progresos en inteligencia artificial requieren necesariamente vastos recursos. En cambio, DeepSeek ha demostrado que la combinación de estrategias innovadoras y colaboración abierta puede producir resultados competitivos a nivel global.

DeepSeek-R1 no es solo un logro técnico impresionante, sino también un testimonio del compromiso de DeepSeek con el crecimiento y la diversificación del ecosistema global de inteligencia artificial. Al proporcionar herramientas avanzadas de manera abierta y accesible, DeepSeek está promoviendo una nueva era de colaboración internacional en el desarrollo de IA.

En síntesis, DeepSeek-R1 representa un modelo de cómo la innovación y la apertura pueden transformar el panorama tecnológico, contribuyendo significativamente al avance colectivo en el campo de la inteligencia artificial.

Atte. Patricio Figueroa G – Estudiante de ICI en PUCV