दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप ने दावा किया है कि उसने अपने शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों की काफी अधिक लागतों के विपरीत। यह प्रतीत होता है कि कम आंकड़ा, हालांकि, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे जैसे पर्याप्त खर्चों को छोड़ देता है।
छवि: ensigame.com
दीपसेक वी 3 की अभिनव वास्तुकला इसकी दक्षता में योगदान देती है। प्रमुख प्रौद्योगिकियों में मल्टी-टोकन भविष्यवाणी (एमटीपी) शामिल हैं, जो एक साथ कई शब्दों की भविष्यवाणी करती है; विशेषज्ञों का मिश्रण (एमओई), त्वरित प्रशिक्षण के लिए 256 तंत्रिका नेटवर्क को नियोजित करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए), बेहतर सटीकता के लिए महत्वपूर्ण वाक्य तत्वों पर ध्यान केंद्रित करना।
छवि: ensigame.com
दीपसेक के प्रचारित आंकड़ों के विपरीत, सेमियालिसिस एक बड़े पैमाने पर कम्प्यूटेशनल बुनियादी ढांचे का खुलासा करता है, जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू शामिल हैं, जिनकी कीमत लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन लागत $ 944 मिलियन तक पहुंच गई है। यह पर्याप्त निवेश, अपने शोधकर्ताओं के लिए उच्च वेतन के साथ मिलकर (सालाना $ 1.3 मिलियन से अधिक), प्रारंभिक $ 6 मिलियन प्रशिक्षण लागत दावे के विपरीत है।
छवि: ensigame.com
दीपसेक की अनूठी संरचना-हाई-फ्लाइर की एक सहायक कंपनी, एक चीनी हेज फंड, अपने डेटा केंद्रों का मालिक है और स्वतंत्र रूप से संचालन करता है-चपलता और नियंत्रण को प्रदान करता है। यह स्व-वित्त पोषित दृष्टिकोण क्लाउड-निर्भर प्रतियोगियों के साथ विरोधाभास करता है। एआई विकास में कंपनी का कुल निवेश $ 500 मिलियन से अधिक है।
छवि: ensigame.com
जबकि दीपसेक की सफलता अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की क्षमता को प्रदर्शित करती है, इसकी "बजट-अनुकूल" कथा एक ओवरसिम्पलीफिकेशन है। वास्तविकता महत्वपूर्ण निवेश, तकनीकी सफलताओं और अपनी उपलब्धियों के सच्चे ड्राइवरों के रूप में एक उच्च कुशल टीम की ओर इशारा करती है। हालांकि, इन पर्याप्त निवेशों के साथ भी, इसकी लागत प्रतियोगियों की तुलना में अभी भी पीली है, जिसमें R1 बनाम CHATGPT के $ 100 मिलियन CHATGPT4O के लिए $ 5 मिलियन खर्च किए गए $ 5 मिलियन के साथ। महत्वपूर्ण लागत अंतर एक प्रमुख विभेदक बना हुआ है।