Hogar >  Noticias >  Breakthrough: Deepseek presenta su verdadero costo de $ 1.6 mil millones

Breakthrough: Deepseek presenta su verdadero costo de $ 1.6 mil millones

Authore: LoganActualizar:Feb 20,2025

El modelo de IA sorprendentemente económico de Deepseek desafía a los gigantes de la industria. La startup china afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, un marcado contraste con los costos significativamente más altos de los competidores. Sin embargo, esta cifra aparentemente baja omite gastos sustanciales como investigación, refinamiento, procesamiento de datos e infraestructura.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 contribuye a su eficiencia. Las tecnologías clave incluyen predicción múltiple (MTP), que predice múltiples palabras simultáneamente; Mezcla de expertos (MOE), empleando 256 redes neuronales para capacitación acelerada; y atención latente de múltiples cabezas (MLA), centrándose en elementos de oración cruciales para mejorar la precisión.

DeepSeek V3Imagen: Ensigame.com

Al contrario de las cifras publicitadas de Deepseek, el semianálisis revela una infraestructura computacional masiva que involucra aproximadamente 50,000 GPU de la tolva nvidia, valorada en aproximadamente $ 1.6 mil millones, con costos operativos que alcanzan los $ 944 millones. Esta inversión sustancial, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), contradice el reclamo inicial de costos de capacitación de $ 6 millones.

DeepSeekImagen: Ensigame.com

La estructura única de Deepseek, una subsidiaria de High-Flyer, un fondo chino de cobertura, posee sus centros de datos y operan de forma independiente, proporciona agilidad y control. Este enfoque autofinanciado contrasta con los competidores dependientes de la nube. La inversión total de la compañía en el desarrollo de IA supera los $ 500 millones.

DeepSeekImagen: Ensigame.com

Si bien el éxito de Deepseek muestra el potencial de las compañías de IA independientes bien financiadas, su narrativa "económica" es una simplificación excesiva. La realidad apunta a una inversión significativa, avances tecnológicos y un equipo altamente calificado como los verdaderos impulsores de sus logros. Sin embargo, incluso con estas inversiones sustanciales, sus costos aún palidecen en comparación con los competidores, con los $ 5 millones reportados gastados en R1 versus los $ 100 millones de CHATGPT para CHATGPT4O. La diferencia de costo significativa sigue siendo un diferenciador clave.