Qué es DeepSeek, la nueva IA que causó un terremoto en Wall Street
Su modelo es de código abierto, con lo que cualquier persona puede examinarlo, modificarlo y desarrollarlo en función de sus necesidades. Su costo de entrenamiento fue diez veces más bajo que el del modelo de OpenAI.
DeepSeek, la última alternativa china para el desarrollo de la inteligencia artificial (IA), está liderando las listas de descargas gracias a una innovadora apuesta por el código abierto, bajos costos y eficiencia; en una irrupción inesperada que podría desafiar la supremacía los modelos estadounidenses en la industria.
DeepSeek-R1 logró ubicarse en el primer puesto en las listas de descargas gratuitas de la tienda de aplicaciones móviles App Store tanto en China como en Estados Unidos, superando al popular ChatGPT.
Este lunes, en las horas previas a la apertura formal de las operaciones en la Bolsa de Nueva York, las acciones de Nvidia, hasta el viernes la empresa de mayor valor de mercado del mundo, se desplomaba cerca del 14 %. Pasado el mediodía, el papel de Nvidia se hundía más de 17,5 % y arrastraba a todo el tecnológico Nasdaq que llegaba a caer 3,2 %. En sintonía, el S&P 500 perdía 1,9 %, mientras que el industrial Dow Jones cedía 0,1%.
El modelo que se está descargando estos días es el R1, lanzado el 20 de enero. Según los expertos, es comparable con el o1 de OpenAI, la firma creadora del ChatGPT, en la resolución de problemas matemáticos, la programación y la inferencia del lenguaje natural.
Su modelo es de código abierto, con lo que cualquier persona puede examinarlo, modificarlo y desarrollarlo en función de sus necesidades, algo que generó un notable impacto en la comunidad de desarrolladores, que destaca su eficiencia y bajo costo.
Algunas voces apuntan a que China busca que sus empresas ganen influencia global con este tipo de modelos para dar forma a los estándares y las prácticas internacionales de las IA, así como ganar mercado en los países en desarrollo.
Además, el lanzamiento se produce días después de que el presidente estadounidense, Donald Trump, anunciaba el proyecto 'Stargate', que invertirá 500.000 millones de dólares en los próximos cuatro años para construir nuevos centros de datos para apoyar proyectos de IA.
DeepSeek llega también después de que Washington impusiese restricciones a la exportación a China de chips de alto rendimiento -como los desarrollados por Nvidia y AMD-, a lo que Pekín respondió con llamadas a la innovación.
"El enfoque de DeepSeek desafía el dominio de EE.UU en IA, demostrando que sus restricciones han sido ineficaces", señaló el académico Li Baiyang al Global Times.

Según la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares, utilizando procesadores gráficos H800 de Nvidia, una versión de capacidad reducida diseñada para el mercado chino. Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo 4o de OpenAI, según The Paper.
Por su parte, DeepSeek señala que su R1 utiliza técnicas avanzadas de aprendizaje automático, lo que le permite "mejorar notablemente" su capacidad para realizar tareas complejas con menos datos previos.
Asimismo, la compañía hizo públicos detalles técnicos de los procesos de entrenamiento del modelo, lo que permite a otros usuarios utilizarlos como base para desarrollar otras herramientas. (con información de Clarín)
Comentarios
Para comentar, debés estar registrado
Por favor, iniciá sesión