Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Çinli girişim, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolar için eğittiğini iddia ediyor ve sadece 2048 GPU kullanıyor, bu da rakiplerin önemli ölçüde daha yüksek maliyetleriyle tam bir tezat oluşturuyor. Ancak bu görünüşte düşük rakam, araştırma, iyileştirme, veri işleme ve altyapı gibi önemli masrafları atlar.
%İmgp%resim: ensigame.com
Deepseek V3'ün yenilikçi mimarisi verimliliğine katkıda bulunur. Anahtar teknolojiler, aynı anda birden fazla kelimeyi öngören çoklu eğimli tahmin (MTP) içerir; Hızlandırılmış eğitim için 256 sinir ağı kullanan uzmanların (MOE) karışımı; ve iyileştirilmiş doğruluk için önemli cümle unsurlarına odaklanarak çok başlı gizli dikkat (MLA).
%İmgp%resim: ensigame.com
Deepseek'in halka açık figürlerinin aksine, Semianaliz, yaklaşık 1.6 milyar dolar değerinde yaklaşık 50.000 NVIDIA Hopper GPU'si içeren büyük bir hesaplama altyapısı ortaya koyuyor ve operasyonel maliyetler 944 milyon dolara ulaşıyor. Bu önemli yatırım, araştırmacılar için yüksek maaşlarla birleştiğinde (yılda 1,3 milyon doları aşan), ilk 6 milyon dolarlık eğitim maliyet iddiasıyla çelişiyor.
%İmgp%resim: ensigame.com
Deepseek'in benzersiz yapısı-High-Flyer'in bir yan kuruluşu, bir Çin hedge fonu, veri merkezlerine sahip olan ve bağımsız olarak faaliyet gösteren-çeviklik ve kontrol sağlar. Bu kendi kendine finanse edilen yaklaşım, buluta bağlı rakiplerle tezat oluşturuyor. Şirketin AI gelişimine toplam yatırımı 500 milyon doları aşıyor.
%İmgp%resim: ensigame.com
Deepseek'in başarısı iyi finanse edilen bağımsız AI şirketlerinin potansiyelini sergilerken, "bütçe dostu" anlatısı aşırı basitleştirme. Gerçek, önemli yatırımlara, teknolojik atılımlara ve başarılarının gerçek itici güçleri olarak yüksek vasıflı bir ekibe işaret ediyor. Bununla birlikte, bu önemli yatırımlarla bile, maliyetleri rakiplere kıyasla hala solgunlaştı ve R1'e 5 milyon dolarlık ChatGPT'nin ChatGPT4O için 100 milyon dolar. Önemli maliyet farkı kilit bir farklılaştırıcı olmaya devam etmektedir.