ভারতীয় শ্রমিকরা তাদের মাথায় স্মার্টফোন বেঁধে দৈনন্দিন কাজকর্ম — রান্না, পরিষ্কার, হাঁটা, কেনাকাটা — ধারণ করছেন ঘণ্টায় প্রায় ২৫০ টাকা ($২.৪০) বিনিময়ে। এই ফুটেজটি কৃত্রিম বুদ্ধিমত্তা (এআই) সিস্টেম প্রশিক্ষণের জন্য ব্যবহৃত হচ্ছে, বিশেষ করে হিউম্যানয়েড রোবটের জন্য যাদের মানুষের চলাফেরা এবং বিশ্বের সাথে মিথস্ক্রিয়া বুঝতে হবে।
কিভাবে ফুটেজ সংগ্রহ করা হয়
\nশ্রমিকরা মাথায় পরার ব্যান্ড বা জোতায় লাগানো স্মার্টফোন ব্যবহার করে সাধারণ কাজের ফার্স্ট-পারসন ভিডিও রেকর্ড করেন। বেতন — ঘণ্টায় প্রায় $২.৪০ — বিশ্বমানের তুলনায় কম, তবে ভারতে অনুরূপ গিগ কাজের মজুরি ১৫০ থেকে ৩০০ টাকা ঘণ্টায় হওয়ায় এটি প্রতিযোগিতামূলক। প্রতিবেদনে শ্রমিকদের নাম উল্লেখ নেই, তবে তারা ক্রমবর্ধমান শ্রমশক্তির অংশ যারা এআই প্রশিক্ষণের কাঁচামাল সরবরাহ করে।
মাথায় লাগানো পদ্ধতিটি তথাকথিত ইগোসেন্ট্রিক ফুটেজ ধারণ করে: পরিধানকারীর দৃষ্টিকোণ থেকে ভিডিও। এটি থার্ড-পারসন ভিডিও থেকে ভিন্ন, যা পুরো শরীর দেখায়। ইগোসেন্ট্রিক ডেটা এআই মডেলকে শিখতে সাহায্য করে যে রোবটের ক্যামেরা বিশ্বকে কীভাবে দেখবে যদি তা হিউম্যানয়েডের ধড় বা মাথায় বসানো হয়।
ডেটা প্রক্রিয়াকরণকারী কোম্পানি
\nদুটি কোম্পানি এই কাঁচা ভিডিওকে ব্যবহারযোগ্য প্রশিক্ষণ ডেটায় রূপান্তরিত করতে জড়িত বলে জানা গেছে। Objectways, যার সদর দপ্তর মার্কিন যুক্তরাষ্ট্রে কিন্তু ভারতে কার্যক্রম রয়েছে, এআই-এর জন্য ডেটা অ্যানোটেশনে বিশেষজ্ঞ। Humyn Lab, যার ভিত্তি বেঙ্গালুরুতে, মানব-কেন্দ্রিক ডেটা সংগ্রহ এবং লেবেলিংয়ের উপর মনোযোগী। উভয় সংস্থা ইগোসেন্ট্রিক ফুটেজ গ্রহণ করে এবং মেটাডেটা — বাউন্ডিং বক্স, অ্যাকশন লেবেল, অবজেক্ট ট্যাগ — যোগ করে যা মেশিন লার্নিং মডেলগুলির শেখার জন্য প্রয়োজন।
কাজটি অত্যন্ত শ্রমসাধ্য। ভিডিওর প্রতিটি সেকেন্ডের জন্য কয়েক মিনিটের মানব অ্যানোটেশন প্রয়োজন হতে পারে কী ঘটছে তা চিহ্নিত করতে: একটি হাত কাপের দিকে যাচ্ছে, একটি পা দোরগোড়া পার হচ্ছে, একজন ব্যক্তি দরজা খুলছে। ফলস্বরূপ ডেটাসেটগুলি তখন রোবট এবং ভার্চুয়াল সহায়ক নির্মাণকারী এআই ডেভেলপারদের কাছে বিক্রি বা লাইসেন্স দেওয়া হয়।
বিনিয়োগকারীদের মূল্যায়ন অনুযায়ী, হিউম্যানয়েড রোবট বাজার ২০৩৫ সালের মধ্যে $৩৮ বিলিয়নে পৌঁছাবে। এই বৃদ্ধি নির্ভর করে রোবটের উপর যা মানুষের পরিবেশ — বাড়ি, অফিস, কারখানা — নেভিগেট করতে পারে আসবাবপত্রে ধাক্কা না খেয়ে বা অঙ্গভঙ্গি ভুল না বুঝে। সেই রোবটগুলিকে প্রশিক্ষণের জন্য বিপুল পরিমাণ ফার্স্ট-পারসন ভিডিও প্রয়োজন যা দেখায় মানুষ কীভাবে প্রকৃতপক্ষে আচরণ করে, কেবল ল্যাবে মঞ্চস্থ কর্ম নয়।
ভারতীয় শ্রমিকদের ফুটেজ একটি ফাঁক পূরণ করে। বর্তমান ইগোসেন্ট্রিক ডেটাসেটগুলির বেশিরভাগই ধনী দেশগুলির গবেষক বা স্বেচ্ছাসেবকদের কাছ থেকে আসে। ভারতীয় ডেটা বৈচিত্র্য যোগ করে: বিভিন্ন বাড়ি, বিভিন্ন বস্তু, বিভিন্ন সাংস্কৃতিক অভ্যাস। এই বৈচিত্র্য এআই সিস্টেমকে আরও ভালোভাবে সাধারণীকরণ করতে সাহায্য করে, যদিও এটি শ্রম শর্ত এবং সম্মতি সম্পর্কে প্রশ্নও তোলে।
কাজ চলতে থাকে। প্রশিক্ষণ ডেটার চাহিদা কমছে না, এবং জড়িত কোম্পানিগুলি সম্ভবত নিয়োগ চালিয়ে যাবে। আপাতত, শ্রমিকরা ফিল্ম করে, অ্যানোটেটররা লেবেল দেয়, এবং রোবটগুলি শেখে — একবারে ২৫০ টাকার এক ঘণ্টা করে।




