Kemampuan visibilitas ChatGPT yang sangat dinanti-nantikan akan segera tersedia, menurut beberapa penyelidik yang jeli.
Tubuh robot Menemukan beberapa baris kode di bagian mode audio lanjutan dari versi beta terbaru ChatGPT v1.2024.317, yang mengacu pada sesuatu yang disebut “kamera langsung”. Ikon tersebut tampaknya merupakan peringatan bagi pengguna untuk tidak menggunakan kamera langsung untuk “navigasi langsung atau pengambilan keputusan yang dapat memengaruhi kesehatan atau keselamatan Anda”.
Baris kode lain tampaknya memberikan instruksi untuk kemampuan penglihatan, dengan mengatakan: “Tekan ikon kamera untuk memungkinkan ChatGPT melihat sekeliling Anda dan mengobrol tentangnya.”
Kecepatan cahaya yang dapat dihaluskan
Pembaruan ChatGPT untuk Windows dan macOS: Semua yang perlu Anda ketahui
Kemampuan ChatGPT yang mutakhir: visi, suara, dan seterusnya
Kemampuan ChatGPT untuk memproses informasi secara visual merupakan fitur utama yang memulai debutnya pada acara OpenAI Mei lalu, saat GPT-4o diluncurkan. Demonstrasi dari acara tersebut menunjukkan bagaimana GPT-4o dapat menggunakan kamera seluler atau desktop untuk mengidentifikasi subjek dan mengingat detail tentang visual. Salah satu demo menunjukkan GPT-4o mengidentifikasi seekor anjing yang sedang bermain bola tenis dan mengingat namanya sebagai “Bowser”.
Sejak acara OpenAI dan akses awal berikutnya ke beberapa penguji alfa yang beruntung, tidak banyak yang dibicarakan tentang GPT-4o dengan Visibilitas. Sementara itu, OpenAI mengirimkan Mode Suara Tingkat Lanjut ke ChatGPT Plus dan pengguna Tim pada bulan September.
Jika visibilitas ChatGPT sudah dekat seperti yang disarankan kode, pengguna akan segera dapat menguji kedua komponen fitur GPT-4o baru yang diperkenalkan musim semi lalu.
Tweet tersebut mungkin telah dihapus
OpenAI sedang sibuk akhir-akhir ini, meskipun ada laporan Hasil yang semakin berkurang Dengan model masa depan. Bulan lalu, mereka meluncurkan ChatGPT Search, yang menghubungkan model AI ke web dan menyediakan informasi real-time. Dikabarkan juga sedang mengerjakan semacam agen yang mampu melakukan tugas multi-langkah atas nama pengguna, seperti menulis kode dan menjelajahi web, dan kemungkinan akan dirilis pada bulan Januari.