Deepseek yang menghairankan model AI yang murah mencabar gergasi industri. Permulaan Cina mendakwa telah melatih rangkaian neural Deepseek V3 yang kuat untuk hanya $ 6 juta, hanya menggunakan 2048 GPU, yang sangat berbeza dengan kos pesaing yang jauh lebih tinggi. Walau bagaimanapun, angka yang seolah -olah rendah ini menghilangkan perbelanjaan besar seperti penyelidikan, penghalusan, pemprosesan data, dan infrastruktur.
imej: ensigame.com
Senibina inovatif Deepseek V3 menyumbang kepada kecekapannya. Teknologi utama termasuk Ramalan Multi-Token (MTP), yang meramalkan beberapa perkataan secara serentak; Campuran Pakar (MOE), menggunakan 256 rangkaian saraf untuk latihan dipercepatkan; dan perhatian laten multi-kepala (MLA), memberi tumpuan kepada elemen kalimat penting untuk ketepatan yang lebih baik.
imej: ensigame.com
Bertentangan dengan angka yang dipublikasikan oleh DeepSeek, semiAnalisis mendedahkan infrastruktur pengiraan besar -besaran yang melibatkan kira -kira 50,000 GPU Nvidia Hopper, bernilai kira -kira $ 1.6 bilion, dengan kos operasi mencapai $ 944 juta. Pelaburan besar ini, ditambah dengan gaji yang tinggi untuk penyelidiknya (melebihi $ 1.3 juta setahun), bercanggah dengan tuntutan kos latihan awal $ 6 juta.
imej: ensigame.com
Struktur unik DeepSeek-anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya dan beroperasi secara bebas-memberikan ketangkasan dan kawalan. Pendekatan yang dibiayai sendiri berbeza dengan pesaing yang bergantung kepada awan. Jumlah pelaburan syarikat dalam pembangunan AI melebihi $ 500 juta.
imej: ensigame.com
Walaupun kejayaan DeepSeek mempamerkan potensi syarikat AI bebas yang dibiayai dengan baik, naratif "mesra bajet" adalah oversimplification. Realiti menunjukkan pelaburan yang signifikan, kejayaan teknologi, dan pasukan yang sangat mahir sebagai pemacu sebenar pencapaiannya. Walau bagaimanapun, walaupun dengan pelaburan yang besar ini, kosnya masih pucat berbanding pesaing, dengan dilaporkan $ 5 juta yang dibelanjakan untuk R1 berbanding $ 100 juta Chatgpt untuk chatgpt4o. Perbezaan kos yang signifikan kekal sebagai pembezaan utama.