El modelo R1 de la inteligencia artificial china logró emparejar los desarrollos más avanzados de ChatGPT y Meta a un bajísimo costo, lo que desató el caos en Wall Street.
Por Matías Morici
La carrera global por la inteligencia artificial (IA) tuvo un punto de quiebre tras el surgimiento de la startup china DeepSeek, con sede en Hangzhou, que gracias a su modelo R1 pudo superar a algunos de los desarrollos más avanzados de OpenAI, lo que desató una ola de reacciones en los mercados tecnológicos.
En menos de una semana, DeepSeek R1 desbancó a ChatGPT como la aplicación más descargada en la App Store de iOS y desplazó a Meta como referente en herramientas de IA de código abierto.
DeepSeek logró lo que muchos consideraban improbable: con un costo estimado en apenas 6 millones de dólares, el modelo R1 alcanzó niveles de rendimiento similares al modelo o1 de OpenAI, un desarrollo respaldado por inversiones multimillonarias de Microsoft. Además, DeepSeek no solo sobresale en capacidad, sino también en accesibilidad económica: acceder a sus funciones más avanzadas cuesta hasta un 95% menos que las ofertas de OpenAI y otros gigantes del sector.
¿Qué es DeepSeek?
DeepSeek, fundada hace menos de dos años por el fondo de cobertura chino High Flyer, se concibió como un laboratorio de investigación con un ambicioso objetivo: desarrollar Inteligencia Artificial General (AGI) para responder a los desafíos más complejos de la humanidad. En 2024, se posicionó como un actor clave en el sector al lanzar una serie de herramientas de código abierto, destacando el modelo «v3», que superó en rendimiento a las propuestas de Meta y rivalizó con el reputado GPT4-o de OpenAI.
Liang Wenfeng, su CEO, convenció a jóvenes investigadores con la promesa de priorizar la innovación sobre las ganancias, además de otorgarles salarios elevados y ofrecerles la chance de participar en proyectos de investigación de vanguardia. Esto permitió a DeepSeek diferenciarse rápidamente en un mercado competitivo, ofreciendo productos altamente eficientes que obligaron a otras empresas chinas a entrar en una guerra de precios. Este enfoque disruptivo no solo consolidó su reputación local, sino que ahora amenaza con impactar el mercado internacional.
A pesar de sus logros, los modelos de DeepSeek también reflejan las limitaciones políticas de su país de origen. Sus algoritmos están diseñados para evitar temas sensibles para el Partido Comunista Chino (PCCh). Por ejemplo, al ser consultado sobre la masacre de Tiananmén de 1989, el modelo R1 responde con frases evasivas, dejando en evidencia los retos éticos y regulatorios que enfrenta la tecnología desarrollada en China.
¿Por qué DeepSeek revolucionó la bolsa de valores? Las compañías estadounidenses, en jaque
El impacto de DeepSeek en los mercados financieros fue inmediato y significativo. El lanzamiento del modelo DeepSeek-V3, apenas un día después de Navidad, puso en alerta a los inversionistas estadounidenses: el software demostró que una startup china podía competir al más alto nivel, pero con una fracción de los costos. Esta revelación impulsó una venta masiva de acciones tecnológicas en Wall Street, reflejando el nerviosismo sobre el ascenso de un nuevo rival.
El informe técnico presentado por DeepSeek reveló que había entrenado su modelo utilizando solo 2000 chips Nvidia, muy por debajo de los 16,000 o más que suelen emplear las grandes compañías de IA en sus supercomputadoras. Esta eficiencia no solo desafía los estándares de la industria, sino que también dejó en evidencia los elevados costos operativos de sus competidores estadounidenses.
Esto tuvo un efecto devastador para Nvidia: el lunes, la empresa sufrió una caída del 17%, lo que representó una pérdida de casi 600.000 millones de dólares en valor de mercado, la mayor disminución en un solo día para cualquier empresa pública, según informó The Wall Street Journal.
Empresas como Microsoft y Google enfrentan ahora una creciente presión para justificar sus altos presupuestos en investigación y desarrollo. La capacidad de DeepSeek para alcanzar resultados similares con menos recursos ha planteado preguntas incómodas sobre la sostenibilidad y eficiencia del modelo de negocios actual en la industria tecnológica estadounidense. Esto podría marcar el inicio de una nueva etapa en la que la innovación no solo sea cuestión de capacidad técnica, sino también de rentabilidad y eficiencia.