Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das chinesische Startup behauptet, sein mächtiges Neuralnetz von Deepseek V3 für nur 6 Millionen US -Dollar ausgebildet zu haben, wobei nur 2048 GPUs ein starker Kontrast zu den deutlich höheren Kosten der Wettbewerber verwendet wurden. Diese scheinbar niedrige Zahl lässt jedoch erhebliche Ausgaben wie Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur aus.
Bild: Ensigame.com
Die innovative Architektur von Deepseek V3 trägt zur Effizienz bei. Zu den Schlüsseltechnologien gehören Multi-Tooken-Vorhersage (MTP), das mehrere Wörter gleichzeitig vorhersagt; Mischung von Experten (MOE), die 256 neuronale Netze für beschleunigte Schulungen einsetzen; und latente Aufmerksamkeit mit mehreren Kopf (MLA), die sich auf entscheidende Satzelemente für eine verbesserte Genauigkeit konzentrieren.
Bild: Ensigame.com
Im Gegensatz zu Deepseeks publizierte Zahlen zeigt die semianalyse eine massive rechnerische Infrastruktur mit ungefähr 50.000 NVIDIA Hopper -GPUs im Wert von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten 944 Millionen US -Dollar erreichten. Diese erhebliche Investition in Verbindung mit hohen Gehältern für seine Forscher (über 1,3 Millionen US -Dollar pro Jahr) widerspricht dem anfänglichen Schulungskosten in Höhe von 6 Millionen US -Dollar.
Bild: Ensigame.com
Deepseeks einzigartige Struktur-eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, der seine Rechenzentren besitzt und unabhängig operiert-, bietet Agilität und Kontrolle. Dieser selbstfinanzierte Ansatz steht im Gegensatz zu Cloud-abhängigen Wettbewerbern. Die Gesamtinvestition des Unternehmens in die KI -Entwicklung übertrifft 500 Millionen US -Dollar.
Bild: Ensigame.com
Während Deepseeks Erfolg das Potenzial gut finanzierter unabhängiger KI-Unternehmen zeigt, ist die "budgetfreundliche" Erzählung eine zu vereinfachte Vereinfachung. Die Realität verweist auf erhebliche Investitionen, technologische Durchbrüche und ein hochqualifiziertes Team als wahre Treiber ihrer Errungenschaften. Trotz dieser erheblichen Investitionen verblassen ihre Kosten im Vergleich zu Wettbewerbern immer noch, wobei 5 Millionen US -Dollar für R1 gegenüber den 100 Millionen US -Dollar für ChatGPT4O ausgewählt wurden. Der signifikante Kostenunterschied bleibt ein wesentliches Unterscheidungsmerkmal.