کارگران هندی گوشیهای هوشمندی را که روی سر نصب میشود به صورت خود میبندند و از کارهای روزمره خود — آشپزی، تمیزکاری، پیادهروی، خرید — به ازای حدود ۲۵۰ روپیه (۲.۴۰ دلار) در ساعت فیلمبرداری میکنند. این فیلمها برای آموزش سیستمهای هوش مصنوعی، بهویژه رباتهای انساننما که نیاز دارند نحوه حرکت و تعامل انسانها با جهان را درک کنند، استفاده میشود.
نحوه جمعآوری فیلمها
کارگران یک گوشی هوشمند را روی یک بند سر یا مهار نصب میکنند و از کارهای معمولی به صورت اول شخص فیلمبرداری میکنند. دستمزد — حدود ۲.۴۰ دلار در ساعت — در مقایسه با استانداردهای جهانی پایین است اما در بخشهایی از هند که دستمزد کارهای مشابه از ۱۵۰ تا ۳۰۰ روپیه در ساعت متغیر است، رقابتی محسوب میشود. نام کارگران در گزارشها ذکر نشده است، اما آنها بخشی از نیروی کار رو به رشدی هستند که مواد خام آموزش هوش مصنوعی را تأمین میکنند.
روش نصب روی سر، فیلمی به نام «اول شخص» یا «از دید اول شخص» تولید میکند: ویدئویی از دیدگاه فرد پوشنده. این با ویدئوی سوم شخص که کل بدن را نشان میدهد متفاوت است. دادههای اول شخص به مدلهای هوش مصنوعی کمک میکند یاد بگیرند که اگر دوربین ربات روی تنه یا سر انساننما نصب شود، جهان را چگونه خواهد دید.
شرکتهای پردازش داده
دو شرکت در تبدیل این ویدئوی خام به دادههای آموزشی قابل استفاده شناخته شدهاند. Objectways که مقر آن در آمریکا است اما در هند نیز فعالیت دارد، در زمینه برچسبگذاری داده برای هوش مصنوعی تخصص دارد. Humyn Lab که در بنگلور مستقر است، بر جمعآوری و برچسبگذاری دادههای انسانمحور تمرکز دارد. هر دو شرکت فیلمهای اول شخص را گرفته و فراداده — جعبههای محدودکننده، برچسبهای عمل، برچسبهای شی — اضافه میکنند که مدلهای یادگیری ماشین برای یادگیری به آن نیاز دارند.
این کار پرزحمت است. هر ثانیه از ویدئو ممکن است به چند دقیقه برچسبگذاری انسانی نیاز داشته باشد تا مشخص شود چه اتفاقی میافتد: دستی که به سمت فنجان میرود، پایی که از آستانه عبور میکند، شخصی که در را باز میکند. مجموعه دادههای حاصل سپس به توسعهدهندگان هوش مصنوعی که رباتها و دستیاران مجازی میسازند فروخته یا مجوز داده میشود.
ارزیابیهای سرمایهگذاران پیشبینی میکند بازار رباتهای انساننما تا سال ۲۰۳۵ به ۳۸ میلیارد دلار برسد. این رشد به رباتهایی بستگی دارد که بتوانند در محیطهای انسانی — خانهها، ادارات، کارخانهها — بدون برخورد با مبلمان یا اشتباه در تفسیر حرکت حرکت کنند. آموزش این رباتها نیازمند حجم عظیمی از ویدئوی اول شخص است که نحوه رفتار واقعی انسانها را نشان دهد، نه فقط حرکات نمایشی در آزمایشگاه.
فیلمهای کارگران هندی این شکاف را پر میکند. بیشتر مجموعه دادههای اول شخص موجود از پژوهشگران یا داوطلبان در کشورهای ثروتمند به دست میآید. دادههای هندی تنوع میافزاید: خانههای متفاوت، اشیاء متفاوت، روالهای فرهنگی متفاوت. این تنوع به سیستمهای هوش مصنوعی کمک میکند بهتر تعمیم دهند، هرچند سوالاتی درباره شرایط کار و رضایت نیز مطرح میکند.
کار ادامه دارد. تقاضا برای دادههای آموزشی کاهش نمییابد و شرکتهای درگیر احتمالاً به استخدام ادامه خواهند داد. در حال حاضر، کارگران فیلمبرداری میکنند، برچسبگذاران برچسب میزنند، و رباتها یاد میگیرند — یک ساعت ۲۵۰ روپیهای در یک زمان.




