Loading market data...

インド人労働者、AIトレーニングのため日常動作を撮影、時給2.40ドル

インド人労働者、AIトレーニングのため日常動作を撮影、時給2.40ドル

インド人労働者たちは、頭に装着したスマートフォンで、料理、掃除、歩行、買い物といった日常のルーティンを撮影している。時給は約250ルピー(2.40ドル)だ。この映像は、特に人間の動きや世界との関わり方を理解する必要があるヒューマノイドロボット向けの人工知能システムのトレーニングに使用されている。

映像の収集方法

労働者はヘッドバンドやハーネスに取り付けたスマートフォンを装着し、日常的な作業の一人称視点映像を記録する。報酬は約2.40ドル/時と世界的には低いが、インドの一部地域では同様のギグワークの時給が150~300ルピーであることを考えると競争力がある。報告書では労働者の名前は明かされていないが、彼らはAIトレーニングの原材料を供給する拡大する労働力の一部である。

ヘッドマウント方式で得られるのは、装着者の視点からの映像、いわゆる自己中心映像(エゴセントリック映像)である。これは全身を映す三人称映像とは異なる。自己中心データは、ロボットのカメラがヒューマノイドの胴体や頭部に搭載された場合にどのように世界を見るかをAIモデルが学習するのに役立つ。

データを処理する企業

この生映像を有用なトレーニングデータに変換する作業に関わっていることが知られている企業が2社ある。米国に拠点を置きインドでも事業を展開するObjectwaysは、AI向けデータアノテーションを専門とする。バンガロールに拠点を置くHumyn Labは、人間中心のデータ収集とラベリングに注力している。両社は自己中心映像にメタデータ(バウンディングボックス、アクションラベル、オブジェクトタグ)を付与し、機械学習モデルが学習できるようにしている。

この作業は骨が折れる。1秒の映像に対して、何が起こっているかを特定するために数分間の手動アノテーションが必要になる場合がある。例えば、手がカップに伸びる、足が敷居をまたぐ、人がドアを開けるなどだ。得られたデータセットは、ロボットやバーチャルアシスタントを開発するAI企業に販売またはライセンス供与される。

投資家の評価によると、ヒューマノイドロボット市場は2035年までに380億ドルに達すると予測されている。その成長は、家具にぶつかったりジェスチャーを誤認したりすることなく、人間の環境(家庭、オフィス、工場)を移動できるロボットに依存している。そうしたロボットのトレーニングには、実験室での作為的な動作だけでなく、実際の人々の振る舞いを捉えた大量の一人称視点映像が必要である。

インド人労働者の映像はそのギャップを埋める。既存の自己中心データセットのほとんどは、裕福な国の研究者やボランティアから得られたものだ。インドのデータは多様性を加える。異なる家庭、異なる物体、異なる文化的習慣。その多様性はAIシステムの汎化能力を高めるが、同時に労働条件や同意に関する疑問も提起する。

作業は続いている。トレーニングデータへの需要は衰える気配がなく、関係企業は今後も採用を続けるだろう。今のところ、労働者が撮影し、アノテーターがラベルを付け、ロボットが学習する——250ルピー単位の時間をかけて。