Google DeepMind는 Project Genie 시스템에 Street View 데이터를 통합해 몰입감 있는 시뮬레이션을 생성했으며, 이를 통해 AI가 실세계 지리 정보에 직접 접근할 수 있는 통로를 제공합니다. 이 결합을 통해 플랫폼은 합성 데이터뿐만 아니라 실제 거리 수준의 영상에서 가상 환경을 생성할 수 있습니다.
통합 방식
Project Genie는 사진, 동영상, 텍스트의 조합을 통해 상호작용 가능한 3D 세계를 구축하는 DeepMind의 프레임워크입니다. Street View의 방대한 지리 태그가 붙은 사진 보관소(100여 개국의 거리 풍경을 담은 수백만 장의 이미지)를 입력하면, 시스템은 이러한 위치를 탐색 가능한 디지털 공간으로 재구성할 수 있습니다. 그 결과는 상점가부터 교차로까지 실제 장소의 외관과 구조를 반영하는 시뮬레이션입니다.
Street View 데이터의 중요성
Street View는 수년에 걸쳐 수집된 라벨링된 위치별 영상을 꾸준히 제공합니다. 이러한 다양성은 Genie 모델이 이상화되거나 허구적인 자산에 의존하지 않고, 다양한 도시, 기후, 건축 양식이 실제 어떻게 보이는지 학습하는 데 도움을 줍니다. AI 학습을 위해 이는 에이전트가 물리적 세계와 유사한 환경에서 탐색 또는 객체 인식과 같은 작업을 연습할 수 있음을 의미합니다.
AI 연구에 미칠 수 있는 영향
실제 데이터로 구축된 시뮬레이션을 통해 연구자들은 인공적으로 재현하기 어려운 조건(예: 마모된 도로 표시, 얽힌 전선, 변화하는 조명)에서 자율 시스템을 테스트할 수 있습니다. 이 기술은 도시 계획 도구, 재해 훈련, 가상 관광 등에도 활용될 수 있습니다. 그러나 DeepMind는 연구 단계를 넘어 구체적인 적용 사례를 밝히지 않았습니다.
한 가지 즉각적인 효과는 이 조치가 지리공간 데이터를 생성형 AI와 더욱 긴밀하게 연결한다는 것입니다. Google은 Street View와 DeepMind를 모두 소유하고 있으므로, 이 통합은 회사 내부에서 이루어집니다. 이는 내부 프로젝트를 가속화할 수 있지만, 생성된 시뮬레이션을 어떻게 공유하거나 라이선스할지에 대한 질문도 제기합니다.
프라이버시는 또 다른 미해결 문제입니다. Street View는 이미지에 담긴 얼굴, 번호판, 개인 재산으로 인해 비판을 받아왔습니다. 이 데이터를 시뮬레이션 구축에 사용하는 것은(재생되거나 내보낼 수 있음) 이러한 우려를 다시 불러일으킬 수 있으며, 특히 생성된 가상 세계가 식별 가능한 세부 정보를 보존할 경우 더욱 그렇습니다.
Google DeepMind는 외부 개발자나 연구자에게 통합 시스템을 공개할 날짜를 정하지 않았습니다. 현재까지는 이 작업이 비공개로 진행되고 있습니다.

