Pekerja India memasang smartphone yang dipasang di kepala dan merekam rutinitas harian mereka — memasak, membersihkan, berjalan, berbelanja — dengan bayaran sekitar 250 rupee ($2,40) per jam. Rekaman tersebut digunakan untuk melatih sistem kecerdasan buatan (AI), terutama robot humanoid yang perlu memahami cara manusia bergerak dan berinteraksi dengan dunia.
Cara pengumpulan rekaman
Pekerja mengenakan smartphone yang dipasang pada ikat kepala atau tali kekang, merekam video sudut pandang orang pertama dari tugas-tugas biasa. Upah — sekitar $2,40 per jam — tergolong rendah menurut standar global tetapi kompetitif di beberapa wilayah India di mana upah untuk pekerjaan serupa berkisar antara 150 hingga 300 rupee per jam. Para pekerja tidak disebutkan namanya dalam laporan, tetapi mereka adalah bagian dari tenaga kerja yang terus bertambah yang menyediakan bahan baku untuk pelatihan AI.
Pendekatan dengan kamera di kepala ini menghasilkan apa yang disebut rekaman egosentris: video dari sudut pandang pengguna. Ini berbeda dengan video orang ketiga yang menunjukkan seluruh tubuh. Data egosentris membantu model AI mempelajari bagaimana kamera robot akan melihat dunia jika dipasang di tubuh atau kepala humanoid.
Perusahaan yang memproses data
Dua perusahaan diketahui terlibat dalam mengubah rekaman mentah ini menjadi data pelatihan yang dapat digunakan. Objectways, yang berbasis di AS tetapi memiliki operasi di India, mengkhususkan diri dalam anotasi data untuk AI. Humyn Lab, yang berbasis di Bangalore, berfokus pada pengumpulan dan pelabelan data yang berpusat pada manusia. Kedua perusahaan mengambil rekaman egosentris dan menambahkan metadata — kotak pembatas, label tindakan, tag objek — yang dibutuhkan model pembelajaran mesin untuk belajar.
Pekerjaan ini membutuhkan ketelitian. Setiap detik video mungkin memerlukan beberapa menit anotasi manusia untuk mengidentifikasi apa yang terjadi: tangan meraih cangkir, kaki melangkah melewati ambang pintu, seseorang membuka pintu. Kumpulan data yang dihasilkan kemudian dijual atau dilisensikan kepada pengembang AI yang membangun robot dan asisten virtual.
Perkiraan investor memproyeksikan pasar robot humanoid akan mencapai $38 miliar pada tahun 2035. Pertumbuhan itu bergantung pada robot yang dapat bernavigasi di lingkungan manusia — rumah, kantor, pabrik — tanpa menabrak furnitur atau salah membaca gerakan. Melatih robot tersebut membutuhkan sejumlah besar video sudut pandang orang pertama yang menunjukkan bagaimana manusia benar-benar berperilaku, bukan hanya tindakan yang dipentaskan di laboratorium.
Rekaman para pekerja India mengisi celah tersebut. Sebagian besar kumpulan data egosentris yang ada berasal dari peneliti atau sukarelawan di negara-negara kaya. Data India menambah variasi: rumah yang berbeda, objek yang berbeda, rutinitas budaya yang berbeda. Keragaman itu membantu sistem AI untuk menggeneralisasi dengan lebih baik, meskipun juga menimbulkan pertanyaan tentang kondisi kerja dan persetujuan.
Pekerjaan terus berlanjut. Permintaan akan data pelatihan tidak melambat, dan perusahaan-perusahaan yang terlibat kemungkinan akan terus merekrut. Untuk saat ini, para pekerja merekam, para anotator memberi label, dan robot belajar — satu jam dengan bayaran 250 rupee dalam satu waktu.




