
¿Qué es DeepSeek? La herramienta que está revolucionando la IA
El mundo de la Inteligencia Artificial (IA) es uno de los sectores tecnológicos que avanza a un ritmo acelerado, incorporando frecuentemente nuevas tecnologías que incluso reemplazan a las más 'antiguas' y empiezan a emplearse en nuestro día a día
EDDC.NET/Madrid
En este artículo, analizamos puntualmente a DeepSeek, una de esas nuevas tecnologías que ha irrumpido con mucha fuerza en el mercado. También, desglosamos los principales detalles de este modelo de IA, su funcionamiento y sus diferencias con otros modelos como el ChatGPT.
DeepSeek: La empresa
DeepSeek es una empresa china, con sede en Hangzhou, especializada en inteligencia artificial, específicamente en la creación de grandes modelos de lenguaje (LLM). Llegó al mercado en julio de 2023, fundada por Liang Wenfeng, un informático y gestor de fondos de cobertura que se ha convertido en uno de los personajes más importantes del sector.
Wenfeng tiene como objetivo lograr una “inteligencia general artificial”, es decir, que tenga una capacidad superior a la de los humanos para el desarrollo de diversas tareas. Para ello, maneja desde 2015 el fondo de cobertura High-Flyer, un fondo centrado en el desarrollo de IA, del que nació DeepSeek.
DeepSeek: El chat
DeepSeek es también el nombre del chatbot de inteligencia artificial de esta compañía, y es en ese chat en lo que nos centraremos en este artículo.
Este chatbot es una aplicación que, en palabras de la propia empresa, está diseñada para 'contestar tus preguntas y mejorar tu vida'. Dos de sus características más destacadas son que es gratuita y de código abierto.
Su tecnología está siendo adoptada por diversos sectores; por ejemplo, algunas plataformas de servicios, comercios e incluso casinos en línea, comienzan a integrar DeepSeek para ofrecer una atención al cliente más personalizada y en tiempo real.
Es completamente gratuito, desde la descarga hasta su funcionamiento, pues no requiere suscripciones premium ni ningún pago extra para acceder a funciones avanzadas.
¿Y qué significa que sea de código abierto? Significa que cualquiera puede ver su código, descargarlo, utilizarlo e incluso modificarlo libremente.
Modelos del chat
Ahora bien, DeepSeek ha lanzado dos increíbles modelos de este chat. El V3, que empezó a generar un impacto mediático en diciembre, y el R1, que se anunció a finales de 2024 y se estrenó en enero de 2025, generando una reacción impresionante en el mercado de valores.
V3
El DeepSeek V3 es un LLM enorme que según diversas pruebas puede responder preguntas y solucionar problemas lógicos con el mismo nivel que las grandes herramientas IA del mercado.
También, puede escribir códigos de programación informática y, de hecho, en este apartado supera a otros LLM importantes como Llama 3.1 405B, a GPT-4o y a Qwen 2.5 72B.
Según la empresa, el costo de entrenamiento de este modelo fue de tan solo 5,5 millones de dólares, y emplearon 14.8 billones de tokens. Es decir, fue un entrenamiento barato y eficiente.
Además, el V3 consta de 671.000 millones de parámetros, lo que lo hace el modelo más grande en este sentido y, normalmente, entre más parámetros, más capacidad.
R1
El DeepSeek R1 llegó sorpresivamente el 20 de enero de 2025 para muchos. Este modelo básicamente comparte características con el anteriormente descrito V3, pero se especializa en el razonamiento para la solución de problemas de matemática, ciencia y programación.
El R1 también tiene 671.000 millones de parámetros y también se desarrolló con un costo muy inferior al del mercado. Una novedad es que este modelo fue desarrollado combinando técnicas de aprendizaje por refuerzo puro y entrenamiento supervisado.
Consiguió un 97,3% de aciertos en solución de problemas matemáticos MATH-500. Una cifra extraordinaria.
Comparación con otras herramientas similares
La primera diferencia de DeepSeek con otros LLM, como el ChatGPT de OpenIA, el Gemini de Google y el Llama de Meta, es su gratuidad total. Los otros modelos mencionados ofrecen suscripciones con servicios especiales por precios que rondan los 20 dólares. DeepSeek no cobra suscripciones, todo su servicio es gratis.
Luego, en cuanto al estilo de funcionamiento, es muy similar a cualquier otro chatbot. Escribes en el campo de escritura una pregunta y recibes muy rápidamente una respuesta con un lenguaje bastante natural. Es un modelo muy conversacional, de respuestas largas que procuran ser más objetivas y menos opinativas que las de sus similares.
En cuanto a valores técnicos, en su mayoría es superior a todos los LLM del mercado. Por ejemplo, en el porcentaje de acierto matemático dijimos que alcanzó el 97,3%, mientras que OpenAI llegó al 96,4%.
Los 5 millones gastados en su entrenamiento fueron nada comparados con los 80 millones que gastó OpenAI. En los parámetros es un 60% más grande que Llama, la cual con sus 405 billones de parámetros era la más grande de la industria.