Loading market data...

Critics Question NIST

Critics Question NIST

The evaluation setup

" -> "

मूल्यांकन की सेटअप

" or better: "मूल्यांकन की व्यवस्था". "setup" can be "सेटअप" or "व्यवस्था". Use "सेटअप" as tech term. Second paragraph: "NIST's CAISI — its Center for AI Safety and Innovation — ran DeepSeek V4 Pro through a series of private benchmarks. The agency didn't release those benchmarks publicly. What it did disclose was a cost-comparison filter that narrowed the field of competing models to just one US entrant: GPT-5.4 mini. Every other US model was excluded from the comparison." Translation: "NIST की CAISI — इसका सेंटर फॉर AI सेफ्टी एंड इनोवेशन — ने DeepSeek V4 Pro को निजी बेंचमार्क की एक श्रृंखला से गुज़ारा। एजेंसी ने उन बेंचमार्क को सार्वजनिक रूप से जारी नहीं किया। इसने जो खुलासा किया वह एक लागत-तुलना फिल्टर था जिसने प्रतिस्पर्धी मॉडलों के क्षेत्र को केवल एक अमेरिकी प्रतियोगी: GPT-5.4 mini तक सीमित कर दिया। तुलना से हर दूसरे अमेरिकी मॉडल को बाहर कर दिया गया।" Note: "Center for AI Safety and Innovation" -> "सेंटर फॉर AI सेफ्टी एंड इनोवेशन" (keep English). "ran ... through" -> "से गुज़ारा". "narrowed the field" -> "क्षेत्र को सीमित कर दिया". Heading: "

Why the filter matters

" -> "

फिल्टर क्यों मायने रखता है

" Third paragraph: "That filter is drawing the most scrutiny. By pitting DeepSeek V4 Pro against only a smaller, cheaper version of GPT-5 — rather than the full lineup of US frontier models — the evaluation creates a narrow playing field. The US government cited the results to assert that China's best AI systems lag behind those developed in the United States. But critics say the methodology makes that claim hard to take at face value." Translation: "वह फिल्टर सबसे अधिक जांच के दायरे में है। DeepSeek V4 Pro को केवल GPT-5 के एक छोटे, सस्ते संस्करण के मुकाबले खड़ा करके — न कि अमेरिकी फ्रंटियर मॉडलों की पूरी श्रृंखला के — मूल्यांकन एक संकीर्ण खेल का मैदान बनाता है। अमेरिकी सरकार ने यह दावा करने के लिए परिणामों का हवाला दिया कि चीन की सबसे अच्छी AI प्रणालियाँ संयुक्त राज्य अमेरिका में विकसित प्रणालियों से पीछे हैं। लेकिन आलोचकों का कहना है कि कार्यप्रणाली उस दावे को सतही तौर पर स्वीकार करना मुश्किल बनाती है।" Note: "drawing the most scrutiny" -> "सबसे अधिक जांच के दायरे में है". "pitting against" -> "के मुकाबले खड़ा करके". "frontier models" -> "फ्रंटियर मॉडल" (keep as is or translate? "सीमांत मॉडल" but better to keep English term). "hard to take at face value" -> "सतही तौर पर स्वीकार करना मुश्किल". Heading: "

Experts call the methodology 'convenient'

" -> "

विशेषज्ञ कार्यप्रणाली को 'सुविधाजनक' कहते हैं

" Fourth paragraph: "Some researchers and industry watchers question the validity of the whole exercise. They describe the filter as 'convenient' — a term that suggests the comparison was engineered to produce a favorable outcome for the US side. By excluding competing US models, the evaluation avoids harder comparisons that might show DeepSeek V4 Pro performing closer to — or even on par with — leading American systems. The critics aren't disputing the raw benchmark data. They're disputing whether that data means what the government says it means." Translation: "कुछ शोधकर्ता और उद्योग पर्यवेक्षक पूरे अभ्यास की वैधता पर सवाल उठाते हैं। वे फिल्टर को 'सुविधाजनक' बताते हैं — एक शब्द जो बताता है कि तुलना को अमेरिकी पक्ष के लिए अनुकूल परिणाम उत्पन्न करने के लिए इंजीनियर किया गया था। प्रतिस्पर्धी अमेरिकी मॉडलों को बाहर करके, मूल्यांकन कठिन तुलनाओं से बचता है जो दिखा सकती थीं कि DeepSeek V4 Pro प्रमुख अमेरिकी प्रणालियों के करीब —