OpenAI telah memperkenalkan fitur pemrosesan suara dan gambar baru untuk ChatGPT, yang memungkinkan pengguna berbicara dengan chatbot dan mengunggah gambar untuk dianalisis oleh AI. Pembaruan ini memperluas alat ini melampaui interaksi berbasis teks, menambahkan lapisan kenyamanan yang dapat mengubah cara orang menggunakan layanan ini sehari-hari.
Apa yang dilakukan fitur baru
Dengan kemampuan suara, pengguna kini dapat berbicara langsung ke ChatGPT daripada mengetik. Sistem ini mengenali ucapan alami dan merespons dengan nada percakapan. Untuk pemrosesan gambar, orang dapat memotret atau mengunggah foto dari galeri mereka, dan AI akan mendeskripsikan apa yang dilihatnya, mengidentifikasi objek, atau menjawab pertanyaan tentang konten tersebut. Perusahaan mengatakan kedua fitur tersebut berfungsi di versi desktop dan seluler ChatGPT.
Bagaimana ini mengubah pengalaman pengguna
Bagi seseorang yang sedang memasak makan malam dan membutuhkan substitusi cepat, input suara berarti mereka tidak perlu berhenti dan mengetik. Seorang pelancong dapat memotret rambu jalan asing dan meminta chatbot untuk menerjemahkan atau menjelaskannya. Kombinasi suara dan visi membawa ChatGPT lebih dekat ke asisten bebas genggam yang memahami konteks dari kata-kata yang diucapkan dan isyarat visual. Fitur-fitur ini akan diluncurkan kepada pengguna dalam beberapa minggu ke depan, meskipun OpenAI belum menentukan tanggal pasti untuk ketersediaan penuh.
Di mana teknologi ini cocok
Chatbot AI lainnya sudah menawarkan input suara atau pengenalan gambar, tetapi mengintegrasikan keduanya ke dalam satu produk yang banyak digunakan seperti ChatGPT adalah langkah yang signifikan. OpenAI secara bertahap menambahkan kemampuan multimodal—awal tahun ini mereka memperkenalkan kemampuan untuk menghasilkan gambar dengan DALL-E, dan sekarang mereka membawa persepsi ke arah yang berlawanan. Perusahaan membingkai pembaruan ini sebagai cara untuk membuat AI lebih intuitif, memungkinkan orang berkomunikasi dengan cara alami: dengan berbicara dan menunjukkan daripada hanya mengetik.
Peluncuran dimulai dengan pelanggan Plus ChatGPT terlebih dahulu, dengan perluasan ke tingkat gratis diperkirakan nanti. Belum ada jadwal pasti kapan semua pengguna akan mendapatkan akses.




