Deepseek's verrassend goedkope AI -model daagt reuzen uit de industrie uit. De Chinese startup beweert zijn krachtige Deepseek V3 -neurale netwerk te hebben getraind voor slechts $ 6 miljoen, met slechts 2048 GPU's, een schril contrast met de aanzienlijk hogere kosten van concurrenten. Dit schijnbaar lage cijfer laat echter aanzienlijke kosten weg, zoals onderzoek, verfijning, gegevensverwerking en infrastructuur.
afbeelding: ensigame.com
De innovatieve architectuur van Deepseek V3 draagt bij aan de efficiëntie ervan. Belangrijke technologieën omvatten multi-token voorspelling (MTP), die tegelijkertijd meerdere woorden voorspelt; Mix van experts (MOE), met 256 neurale netwerken voor versnelde training; en multi-head latente aandacht (MLA), gericht op cruciale zinselementen voor verbeterde nauwkeurigheid.
afbeelding: ensigame.com
In tegenstelling tot de gepubliceerde cijfers van Deepseek, onthult semianalysis een massale computationele infrastructuur met ongeveer 50.000 Nvidia -hopper GPU's, met een waarde van ongeveer $ 1,6 miljard, met operationele kosten tot $ 944 miljoen. Deze substantiële investering, in combinatie met hoge salarissen voor zijn onderzoekers (meer dan $ 1,3 miljoen per jaar), is in tegenspraak met de initiële claim van $ 6 miljoen opleidingskosten.
afbeelding: ensigame.com
De diepe structuur van Deepseek-een dochteronderneming van high-flyer, een Chinees hedgefonds, dat zijn datacenters bezit en onafhankelijk opereert-biedt behendigheid en controle. Deze zelf gefinancierde aanpak staat in contrast met cloud-afhankelijke concurrenten. De totale investering van het bedrijf in AI -ontwikkeling overtreft $ 500 miljoen.
afbeelding: ensigame.com
Hoewel het succes van Deepseek het potentieel van goed gefinancierde onafhankelijke AI-bedrijven toont, is het "budgetvriendelijke" verhaal een oververeenvoudiging. De realiteit wijst op aanzienlijke investeringen, technologische doorbraken en een zeer bekwaam team als de echte factoren van zijn prestaties. Zelfs met deze substantiële investeringen, zijn de kosten echter nog steeds bleek in vergelijking met concurrenten, met een gerapporteerde $ 5 miljoen uitgegeven aan R1 versus Chatgpt's $ 100 miljoen voor Chatgpt4o. Het aanzienlijke kostenverschil blijft een belangrijke onderscheidende factor.