Loading market data...

کارگران هندی با دستمزد ۲.۴۰ دلار در ساعت برای فیلمبرداری از کارهای روزمره برای آموزش هوش مصنوعی

کارگران هندی با دستمزد ۲.۴۰ دلار در ساعت برای فیلمبرداری از کارهای روزمره برای آموزش هوش مصنوعی

کارگران هندی گوشی‌های هوشمندی را که روی سر نصب می‌شود به صورت خود می‌بندند و از کارهای روزمره خود — آشپزی، تمیزکاری، پیاده‌روی، خرید — به ازای حدود ۲۵۰ روپیه (۲.۴۰ دلار) در ساعت فیلمبرداری می‌کنند. این فیلم‌ها برای آموزش سیستم‌های هوش مصنوعی، به‌ویژه ربات‌های انسان‌نما که نیاز دارند نحوه حرکت و تعامل انسان‌ها با جهان را درک کنند، استفاده می‌شود.

نحوه جمع‌آوری فیلم‌ها

کارگران یک گوشی هوشمند را روی یک بند سر یا مهار نصب می‌کنند و از کارهای معمولی به صورت اول شخص فیلمبرداری می‌کنند. دستمزد — حدود ۲.۴۰ دلار در ساعت — در مقایسه با استانداردهای جهانی پایین است اما در بخش‌هایی از هند که دستمزد کارهای مشابه از ۱۵۰ تا ۳۰۰ روپیه در ساعت متغیر است، رقابتی محسوب می‌شود. نام کارگران در گزارش‌ها ذکر نشده است، اما آن‌ها بخشی از نیروی کار رو به رشدی هستند که مواد خام آموزش هوش مصنوعی را تأمین می‌کنند.

روش نصب روی سر، فیلمی به نام «اول شخص» یا «از دید اول شخص» تولید می‌کند: ویدئویی از دیدگاه فرد پوشنده. این با ویدئوی سوم شخص که کل بدن را نشان می‌دهد متفاوت است. داده‌های اول شخص به مدل‌های هوش مصنوعی کمک می‌کند یاد بگیرند که اگر دوربین ربات روی تنه یا سر انسان‌نما نصب شود، جهان را چگونه خواهد دید.

شرکت‌های پردازش داده

دو شرکت در تبدیل این ویدئوی خام به داده‌های آموزشی قابل استفاده شناخته شده‌اند. Objectways که مقر آن در آمریکا است اما در هند نیز فعالیت دارد، در زمینه برچسب‌گذاری داده برای هوش مصنوعی تخصص دارد. Humyn Lab که در بنگلور مستقر است، بر جمع‌آوری و برچسب‌گذاری داده‌های انسان‌محور تمرکز دارد. هر دو شرکت فیلم‌های اول شخص را گرفته و فراداده — جعبه‌های محدودکننده، برچسب‌های عمل، برچسب‌های شی — اضافه می‌کنند که مدل‌های یادگیری ماشین برای یادگیری به آن نیاز دارند.

این کار پرزحمت است. هر ثانیه از ویدئو ممکن است به چند دقیقه برچسب‌گذاری انسانی نیاز داشته باشد تا مشخص شود چه اتفاقی می‌افتد: دستی که به سمت فنجان می‌رود، پایی که از آستانه عبور می‌کند، شخصی که در را باز می‌کند. مجموعه داده‌های حاصل سپس به توسعه‌دهندگان هوش مصنوعی که ربات‌ها و دستیاران مجازی می‌سازند فروخته یا مجوز داده می‌شود.

ارزیابی‌های سرمایه‌گذاران پیش‌بینی می‌کند بازار ربات‌های انسان‌نما تا سال ۲۰۳۵ به ۳۸ میلیارد دلار برسد. این رشد به ربات‌هایی بستگی دارد که بتوانند در محیط‌های انسانی — خانه‌ها، ادارات، کارخانه‌ها — بدون برخورد با مبلمان یا اشتباه در تفسیر حرکت حرکت کنند. آموزش این ربات‌ها نیازمند حجم عظیمی از ویدئوی اول شخص است که نحوه رفتار واقعی انسان‌ها را نشان دهد، نه فقط حرکات نمایشی در آزمایشگاه.

فیلم‌های کارگران هندی این شکاف را پر می‌کند. بیشتر مجموعه داده‌های اول شخص موجود از پژوهشگران یا داوطلبان در کشورهای ثروتمند به دست می‌آید. داده‌های هندی تنوع می‌افزاید: خانه‌های متفاوت، اشیاء متفاوت، روال‌های فرهنگی متفاوت. این تنوع به سیستم‌های هوش مصنوعی کمک می‌کند بهتر تعمیم دهند، هرچند سوالاتی درباره شرایط کار و رضایت نیز مطرح می‌کند.

کار ادامه دارد. تقاضا برای داده‌های آموزشی کاهش نمی‌یابد و شرکت‌های درگیر احتمالاً به استخدام ادامه خواهند داد. در حال حاضر، کارگران فیلمبرداری می‌کنند، برچسب‌گذاران برچسب می‌زنند، و ربات‌ها یاد می‌گیرند — یک ساعت ۲۵۰ روپیه‌ای در یک زمان.