OpenAI가 ChatGPT에 새로운 음성 및 이미지 처리 기능을 도입하여 사용자가 챗봇과 대화하거나 사진을 업로드해 AI가 분석하도록 할 수 있게 되었습니다. 이번 업데이트는 텍스트 기반 상호작용을 넘어 도구의 범위를 확장하며, 서비스를 일상적으로 사용하는 방식을 바꿀 수 있는 편의성을 더했습니다.
새로운 기능의 역할
음성 기능을 통해 사용자는 이제 타이핑 대신 ChatGPT에 직접 말을 걸 수 있습니다. 시스템은 자연스러운 음성을 인식하고 대화체로 응답합니다. 이미지 처리의 경우, 사용자가 사진을 찍거나 갤러리에서 업로드하면 AI가 본 내용을 설명하고, 물체를 식별하거나 내용에 대한 질문에 답변합니다. 회사는 두 기능 모두 ChatGPT의 데스크톱 및 모바일 버전에서 작동한다고 밝혔습니다.
사용자 경험의 변화
저녁을 요리하다가 빠른 대체 재료가 필요한 사람에게 음성 입력은 멈춰서 타이핑할 필요가 없음을 의미합니다. 여행자는 외국 길거리 표지판 사진을 찍어 챗봇에게 번역이나 설명을 요청할 수 있습니다. 음성과 시각의 결합은 ChatGPT를 음성 단어와 시각적 신호 모두에서 맥락을 이해하는 핸즈프리 어시스턴트에 더 가깝게 만듭니다. 이 기능들은 앞으로 몇 주에 걸쳐 사용자에게 제공되지만, OpenAI는 완전한 이용 가능 시점을 구체적으로 밝히지 않았습니다.
기술의 위치
다른 AI 챗봇들은 이미 음성 입력이나 이미지 인식을 제공하고 있지만, 이 둘을 하나의 널리 사용되는 제품인 ChatGPT에 통합한 것은 주목할 만한 진전입니다. OpenAI는 점차 멀티모달 기능을 추가해 왔으며, 올해 초 DALL-E로 이미지 생성 기능을 도입한 데 이어 이제는 반대 방향의 인식 기능을 제공합니다. 회사는 이번 업데이트를 AI를 더 직관적으로 만들어 사람들이 타자만 치는 대신 말하고 보여주는 자연스러운 방식으로 소통할 수 있게 하는 방법으로 설명합니다.
이번 출시는 먼저 ChatGPT의 Plus 구독자부터 시작되며, 무료 버전 확장은 추후에 이루어질 예정입니다. 모든 사용자가 접근할 수 있는 정확한 일정은 아직 공개되지 않았습니다.




