Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La startup cinese afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli 6 milioni di dollari, utilizzando solo 2048 GPU, un netto contrasto con i costi significativamente più elevati dei concorrenti. Questa cifra apparentemente bassa, tuttavia, omette spese sostanziali come ricerca, perfezionamento, elaborazione dei dati e infrastruttura.
Immagine: Ensigame.com
L'architettura innovativa di Deepseek V3 contribuisce alla sua efficienza. Le tecnologie chiave includono la previsione multi-token (MTP), che prevede contemporaneamente più parole; Miscela di esperti (MOE), che impiegano 256 reti neurali per la formazione accelerata; e l'attenzione latente a più testa (MLA), concentrandosi su elementi di frase cruciale per una migliore precisione.
Immagine: Ensigame.com
Contrariamente alle cifre pubblicizzate di DeepSeek, la semianalisi rivela una massiccia infrastruttura computazionale che coinvolge circa 50.000 GPU di Nvidia Hopper, valutate a circa $ 1,6 miliardi, con costi operativi che hanno raggiunto $ 944 milioni. Questo investimento sostanziale, unito ad alti salari per i suoi ricercatori (che superano l'anno di $ 1,3 milioni all'anno), contraddice il reclamo iniziale di costi di formazione da 6 milioni di dollari.
Immagine: Ensigame.com
La struttura unica di Deepseek-una consociata di High-Flyer, un hedge fund cinese, che possiede i suoi data center e opera in modo indipendente-fornisce agilità e controllo. Questo approccio autofinanziato contrasta con i concorrenti dipendenti dal cloud. L'investimento totale della società nello sviluppo dell'IA supera $ 500 milioni.
Immagine: Ensigame.com
Mentre il successo di Deepseek mostra il potenziale di società di intelligenza artificiale indipendenti ben finanziate, la sua narrazione "economica" è una semplificazione eccessiva. La realtà indica investimenti significativi, scoperte tecnologiche e una squadra altamente qualificata come i veri driver dei suoi risultati. Tuttavia, anche con questi investimenti sostanziali, i suoi costi sono ancora in confronto ai concorrenti, con $ 5 milioni segnalati spesi su R1 rispetto a $ 100 milioni di CHATGPT per Chatgpt4o. La differenza di costo significativa rimane un differenziatore chiave.