लागत कहाँ बढ़ रही है
आर्मस्ट्रॉन्ग भविष्यवाणी करते हैं कि अगले 12 से 18 महीनों में, लगभग 80% AI कार्यभार ऐसे मॉडलों में स्थानांतरित हो जाएगा जिनकी लागत आज के अत्याधुनिक सिस्टम से 99% तक कम होगी। शेष 20% अभी भी वैज्ञानिक अनुसंधान जैसे उच्च-दांव वाले कार्यों के लिए शीर्ष-स्तरीय मॉडल का उपयोग करेगा। उन्होंने इस विभाजन की तुलना उपभोक्ता इलेक्ट्रॉनिक्स से की: अधिकांश लोग MacBook या गेमिंग PC खरीदते समय अधिकतम स्पेसिफिकेशन नहीं चुनते। उनका कहना है कि यही तर्क AI पर भी लागू होगा — अधिकांश कार्य सस्ते, पर्याप्त-अच्छे मॉडलों पर चलेंगे।
Coinbase पहले से ही इस विचार को व्यवहार में ला रहा है। कंपनी प्रॉम्प्ट को सबसे किफायती उपलब्ध मॉडल पर रूट करती है, जिससे टोकन उपयोग में तेजी से वृद्धि के बावजूद उसका AI खर्च लगभग स्थिर बना हुआ है। DeepSeek V4 जैसे ओपन-सोर्स विकल्प, जो सबसे अच्छे मालिकाना सिस्टम के करीब प्रदर्शन करते हैं और लगभग एक-तिहाई लागत पर उपलब्ध हैं, इस रणनीति को संभव बना रहे हैं।
उद्यम बजट पहले से ही दबाव में हैं
निवेशक टॉमी शॉनघनेसी ने Uber को एक केस स्टडी के रूप में प्रस्तुत किया कि कैसे उद्यम AI खर्च तेजी से अनुमानों से अधिक हो सकता है। शॉनघनेसी के अनुसार, Uber ने वर्ष के चार महीने से भी कम समय में, अप्रैल की शुरुआत तक अपना पूरा 2026 AI बजट खर्च कर दिया। आर्मस्ट्रॉन्ग का तर्क है कि इस तरह की लागत वृद्धि कंपनियों को सबसे उन्नत मॉडल का पीछा करने के बजाय सस्ते विकल्पों की तलाश करने के लिए प्रेरित करेगी।
जैसे-जैसे प्रति-टोकन लागत घटती है, अड़चन ऊपर की ओर स्थानांतरित हो जाती है। असली बाधा वह ऊर्जा और सिलिकॉन बन जाती है जो किसी भी मॉडल को स्केल पर चलाने के लिए आवश्यक है। आर्मस्ट्रॉन्ग AI-जनित बुद्धिमत्ता की मांग को बिना किसी व्यावहारिक सीमा के बताते हैं। लेकिन उस बुद्धिमत्ता की आपूर्ति करने के लिए भौतिक बुनियादी ढांचा पहले से ही ठप हो रहा है।



