Loading market data...

OpenAI Tambah Keupayaan Suara dan Imej pada ChatGPT

OpenAI Tambah Keupayaan Suara dan Imej pada ChatGPT

OpenAI telah memperkenalkan ciri pemprosesan suara dan imej baharu untuk ChatGPT, membolehkan pengguna bercakap dengan chatbot dan memuat naik gambar untuk dianalisis oleh AI. Kemas kini ini memperluaskan alat tersebut daripada interaksi berasaskan teks, menambah lapisan kemudahan yang boleh mengubah cara orang menggunakan perkhidmatan ini setiap hari.

Apa yang dilakukan oleh ciri baharu ini

Dengan keupayaan suara, pengguna kini boleh bercakap terus dengan ChatGPT tanpa perlu menaip. Sistem ini mengenali pertuturan semula jadi dan bertindak balas dalam nada perbualan. Untuk pemprosesan imej, orang boleh mengambil gambar atau memuat naik satu daripada galeri kamera mereka, dan AI akan menerangkan apa yang dilihatnya, mengenal pasti objek, atau menjawab soalan tentang kandungan tersebut. Syarikat itu mengatakan kedua-dua ciri berfungsi pada versi desktop dan mudah alih ChatGPT.

Bagaimana ia mengubah pengalaman pengguna

Bagi seseorang yang sedang memasak makan malam dan memerlukan pengganti bahan dengan cepat, input suara bermakna mereka tidak perlu berhenti dan menaip. Seorang pengembara boleh mengambil gambar papan tanda jalan asing dan meminta chatbot untuk menterjemah atau menerangkannya. Gabungan suara dan penglihatan membawa ChatGPT lebih dekat kepada pembantu bebas tangan yang memahami konteks daripada kedua-dua perkataan yang diucapkan dan isyarat visual. Ciri-ciri ini akan dilancarkan kepada pengguna dalam beberapa minggu akan datang, walaupun OpenAI tidak menyatakan tarikh tepat untuk ketersediaan penuh.

Di mana teknologi ini sesuai

Chatbot AI lain sudah menawarkan input suara atau pengecaman imej, tetapi mengintegrasikan kedua-duanya ke dalam satu produk yang digunakan secara meluas seperti ChatGPT adalah langkah yang ketara. OpenAI secara beransur-ansur menambah keupayaan multimodal—awal tahun ini ia memperkenalkan keupayaan untuk menjana imej dengan DALL-E, dan kini ia membawa persepsi ke arah yang bertentangan. Syarikat itu membingkaikan kemas kini ini sebagai cara untuk menjadikan AI lebih intuitif, membolehkan orang berkomunikasi dengan cara semula jadi: dengan bercakap dan menunjukkan daripada hanya menaip.

Pelancaran bermula dengan pelanggan Plus ChatGPT terlebih dahulu, dengan pengembangan peringkat percuma dijangka kemudian. Tiada garis masa yang tepat diberikan untuk bila semua pengguna akan mendapat akses.