OpenAI mengumumkan peningkatan besar pada model kecerdasan buatan (AI) terbarunya GPT-4 Turbo pada hari Selasa. Model AI kini dilengkapi dengan kemampuan computer vision, yang memungkinkannya memproses dan menganalisis input multimedia. Dapat menjawab pertanyaan tentang foto, video, dan lainnya. Perusahaan juga menyoroti beberapa alat AI yang didukung oleh GPT-4 Turbo dengan Vision termasuk asisten pengkodean AI Devin dan fitur Snap Healthify. Minggu lalu, perusahaan AI memperkenalkan fitur baru yang memungkinkan pengguna mengedit gambar yang dihasilkan oleh DALL-E 3 dalam ChatGPT.
Pengumuman tersebut dilakukan melalui akun resmi OpenAI Developers, yang bertuliskan X (sebelumnya dikenal sebagai Twitter): surat“GPT-4 Turbo dengan Vision kini tersedia secara umum di API. Permintaan Vision kini juga dapat menggunakan mode JSON dan fungsi panggilan. Nantinya, komputasi X OpenAI juga muncul membuka Fitur ini sekarang tersedia di API dan diluncurkan ke ChatGPT.
GPT-4 Turbo dengan Vision pada dasarnya adalah model dasar GPT-4 dengan output kode lebih tinggi yang diperkenalkan dengan model Turbo, dan kini hadir dengan visi komputer yang ditingkatkan untuk menganalisis file multimedia. Kemampuan penglihatan dapat digunakan dalam banyak cara. Pengguna akhir, misalnya, dapat menggunakan kemampuan ini dengan mengunggah gambar Taj Mahal ke ChatGPT, dan meminta mereka menjelaskan bahan pembuat bangunan tersebut. Pengembang dapat mengambil langkah lebih jauh dan menyesuaikan kemampuan alat mereka untuk tujuan tertentu.
OpenAI menyoroti beberapa kasus penggunaan ini di postingannya. Chatbot Devin dari Cognition AI, asisten pengkodean bertenaga AI, menggunakan GPT-4 Turbo dengan Vision untuk menyelesaikan tugas pengkodean yang rumit dan kotak pasirnya sendiri untuk membuat perangkat lunak.
Demikian pula, platform pelacakan kalori dan umpan balik nutrisi India, Healthify, memiliki fitur yang disebut Snap di mana pengguna dapat mengklik foto suatu makanan atau masakan, dan platform tersebut mengungkapkan potensi kalori di dalamnya. Dan dengan GPT-4 Turbo dengan kemampuan Vision, kini juga merekomendasikan apa yang harus dilakukan pengguna untuk membakar kalori berlebih atau cara mengurangi kalori dalam makanan.
Khususnya, model AI ini memiliki jendela konteks 1,28,000 token dan data pelatihannya berlangsung hingga Desember 2023.