Google DeepMindは、Street ViewのデータをProject Genieシステムに統合し、没入型シミュレーションを生成することで、AIに現実世界の地理情報を直接提供できるようにした。この組み合わせにより、プラットフォームは合成データだけでなく、実際の街並み画像から仮想環境を生成できるようになる。
統合の仕組み
Project Genieは、DeepMindが開発した、写真、動画、テキストを組み合わせてインタラクティブな3D世界を構築するフレームワークである。100カ国以上で撮影された何百万もの街並み画像を収めたStreet Viewの大規模な地理タグ付き写真アーカイブを取り込むことで、システムはそれらの場所をナビゲーション可能なデジタル空間として再構築する。その結果、店先から交差点に至るまで、現実の場所の外観とレイアウトを反映したシミュレーションが生成される。
Street Viewデータの重要性
Street Viewは、長年にわたって収集された、ラベル付きで場所固有の画像の安定した流れを提供する。その多様性により、Genieのモデルは、理想化されたり架空のアセットに頼るのではなく、さまざまな都市、気候、建築様式が実際にどのように見えるかを学習できる。AIトレーニングにとっては、エージェントが現実世界のように動作する環境で、ナビゲーションや物体認識などのタスクを練習できることを意味する。
AI研究への影響
実際のデータから構築されたシミュレーションにより、研究者は人工的に再現するのが難しい状況(摩耗した道路標示、絡まった電線、変化する光など)で自律システムをテストできる。この技術は、都市計画ツール、災害訓練、さらにはバーチャルツーリズムも支援する可能性がある。しかしDeepMindは、研究段階を超えた具体的な応用については詳しく説明していない。
すぐに考えられる効果の一つは、地理空間データと生成AIの結びつきが強まることだ。GoogleはStreet ViewとDeepMindの両方を所有しているため、この統合は社内にとどまる。これにより内部プロジェクトが加速する可能性がある一方で、結果として得られるシミュレーションの共有やライセンス方法について疑問も生じる。
プライバシーも別の未解決の問題である。Street Viewは、その画像に写った顔、ナンバープレート、私有地について批判にさらされてきた。そのデータを使ってシミュレーションを構築することは、特に生成された世界が識別可能な詳細を保持している場合、再生やエクスポートが可能であるため、これらの懸念を再燃させる。
Google DeepMindは、統合システムを外部の開発者や研究者にリリースする日時を設定していない。現時点では、この作業は非公開のまま進められている。


