Loading market data...

भारतीय कर्मचारियों को AI प्रशिक्षण के लिए रोजमर्रा की गतिविधियाँ फिल्माने पर $2.40 प्रति घंटा मिलता है

भारतीय कर्मचारियों को AI प्रशिक्षण के लिए रोजमर्रा की गतिविधियाँ फिल्माने पर $2.40 प्रति घंटा मिलता है

भारतीय कर्मचारी अपने चेहरे पर सिर पर लगे स्मार्टफोन बांधकर अपनी दिनचर्या — खाना बनाना, सफाई करना, चलना, खरीदारी करना — लगभग 250 रुपये ($2.40) प्रति घंटे की दर से फिल्मा रहे हैं। यह फुटेज कृत्रिम बुद्धिमत्ता प्रणालियों को प्रशिक्षित करने के लिए उपयोग किया जा रहा है, विशेष रूप से मानवाकार रोबोटों के लिए जिन्हें यह समझने की आवश्यकता है कि लोग कैसे चलते हैं और दुनिया के साथ बातचीत करते हैं।

फुटेज कैसे एकत्र किया जाता है

\n

कर्मचारी हेडबैंड या हार्नेस पर लगे स्मार्टफोन पहनते हैं, जो सामान्य कार्यों का प्रथम-व्यक्ति वीडियो रिकॉर्ड करता है। भुगतान — लगभग $2.40 प्रति घंटा — वैश्विक मानकों से कम है, लेकिन भारत के उन हिस्सों में प्रतिस्पर्धी है जहां समान गिग कार्य के लिए मजदूरी 150 से 300 रुपये प्रति घंटे तक होती है। रिपोर्टों में कर्मचारियों के नाम नहीं बताए गए हैं, लेकिन वे बढ़ती श्रम शक्ति का हिस्सा हैं जो AI प्रशिक्षण के लिए कच्चा माल प्रदान करती है।

सिर पर लगा दृष्टिकोण तथाकथित स्व-केंद्रित फुटेज कैप्चर करता है: पहनने वाले के दृष्टिकोण से वीडियो। यह तीसरे-व्यक्ति वीडियो से अलग है, जो पूरे शरीर को दिखाता है। स्व-केंद्रित डेटा AI मॉडल को यह सीखने में मदद करता है कि यदि रोबोट का कैमरा मानवाकार धड़ या सिर पर लगा हो तो वह दुनिया को कैसे देखेगा।

डेटा प्रोसेस करने वाली कंपनियाँ

\n

दो कंपनियाँ इस कच्चे वीडियो को उपयोगी प्रशिक्षण डेटा में बदलने में शामिल होने के लिए जानी जाती हैं। Objectways, जो अमेरिका में स्थित है लेकिन भारत में इसका संचालन है, AI के लिए डेटा एनोटेशन में विशेषज्ञता रखती है। बंगलौर स्थित Humyn Lab, मानव-केंद्रित डेटा संग्रह और लेबलिंग पर ध्यान केंद्रित करती है। दोनों फर्में स्व-केंद्रित फुटेज लेती हैं और मेटाडेटा — बाउंडिंग बॉक्स, क्रिया लेबल, ऑब्जेक्ट टैग — जोड़ती हैं, जिसकी मशीन लर्निंग मॉडल को सीखने के लिए आवश्यकता होती है।

यह काम कठिन है। वीडियो के प्रत्येक सेकंड के लिए यह पहचानने में कई मिनट की मानव एनोटेशन की आवश्यकता हो सकती है कि क्या हो रहा है: एक हाथ कप के लिए पहुँच रहा है, एक पैर दहलीज पर कदम रख रहा है, एक व्यक्ति दरवाजा खोल रहा है। परिणामी डेटासेट तब रोबोट और वर्चुअल असिस्टेंट बनाने वाले AI डेवलपर्स को बेचे या लाइसेंस दिए जाते हैं।

निवेशक आकलनों के अनुसार, मानवाकार रोबोट बाजार 2035 तक $38 बिलियन तक पहुँचने का अनुमान है। यह वृद्धि ऐसे रोबोटों पर निर्भर करती है जो मानव वातावरण — घरों, कार्यालयों, कारखानों — में बिना फर्नीचर से टकराए या किसी इशारे को गलत समझे नेविगेट कर सकें। उन रोबोटों को प्रशिक्षित करने के लिए बड़ी मात्रा में प्रथम-व्यक्ति वीडियो की आवश्यकता होती है जो यह दिखाए कि लोग वास्तव में कैसे व्यवहार करते हैं, न कि केवल प्रयोगशाला में मंचित क्रियाएँ।

भारतीय कर्मचारियों का फुटेज इस अंतर को भरता है। अधिकांश मौजूदा स्व-केंद्रित डेटासेट अमीर देशों के शोधकर्ताओं या स्वयंसेवकों से आते हैं। भारतीय डेटा विविधता जोड़ता है: अलग-अलग घर, अलग-अलग वस्तुएँ, अलग-अलग सांस्कृतिक दिनचर्या। यह विविधता AI प्रणालियों को बेहतर सामान्यीकरण करने में मदद करती है, हालांकि यह श्रम स्थितियों और सहमति के बारे में प्रश्न भी उठाती है।

काम जारी है। प्रशिक्षण डेटा की मांग धीमी नहीं हो रही है, और शामिल कंपनियाँ संभवतः काम पर रखना जारी रखेंगी। अभी के लिए, कर्मचारी फिल्माते हैं, एनोटेटर लेबल लगाते हैं, और रोबोट सीखते हैं — एक बार में 250 रुपये प्रति घंटा।