Sistem xAI Elon Musk menghadirkan pemahaman gambar ke Grok AI

Elon Musk, pendiri perusahaan kecerdasan buatan (AI) xAI, mengumumkan fitur baru untuk aplikasi Grok pada hari Senin. Chatbot internal kini memiliki kemampuan pemahaman gambar yang memungkinkannya memproses dan menganalisis konten dalam gambar. Pengguna sekarang dapat mengunggah gambar dan mengajukan pertanyaan AI berdasarkan gambar tersebut. Perlu dicatat bahwa xAI merilis model AI Grok-2 pada bulan Agustus. Saat itu, perusahaan mengumumkan bahwa model AI akan segera mendukung berbagai modalitas.

Grok AI mendapatkan kemampuan untuk memahami gambar

Di sebuah surat Di X (sebelumnya dikenal sebagai Twitter), akun resmi Grok mengumumkan kemampuan pemahaman gambar baru dari chatbot bertenaga AI miliknya. Pemahaman gambar, juga dikenal sebagai visi komputer, memungkinkan sistem AI untuk melihat dan memproses data visual dalam gambar atau video. Saat ini, kemampuan ini hanya tersedia untuk gambar diam.

Musk juga untuk mempublikasikan Mengenai fitur baru ini, kami menyoroti bahwa chatbot bertenaga AI dapat melakukan analisis gambar lebih dalam dan bahkan menjelaskan arti lelucon visual. Berbagi contoh, seorang miliarder meminta Groke menjelaskan lelucon dalam sebuah foto. AI mampu menjelaskan premis, perkembangan, dan lelucon visual lelucon tersebut.

Namun, visi komputer bukanlah kemampuan baru untuk sistem AI, dan hampir semua model AI utama menawarkan fitur ini termasuk Gemini, ChatGPT, Copilot, Claude, dan banyak lagi. Seorang pengguna X menyoroti hal ini dan menyampaikan kekhawatiran bahwa ada beberapa fitur inti yang masih hilang di Grok.

Di sebuah komentar Dalam postingan Musk, pengguna mengatakan AI chatbot masih belum memiliki kemampuan untuk mengunggah file dan membuat gambar. “Tidak lama lagi,” jawab pengusaha miliarder itu. Kami telah mencapainya dalam waktu berbulan-bulan, apa yang membutuhkan waktu bertahun-tahun bagi semua orang. Kemampuan ini mungkin akan ditambahkan ke Grok dalam waktu dekat.

Pada bulan Agustus, xAI merilis model Mini AI Grok-2 dan Grok-2, sebagai peningkatan ke versi beta dari Large Language Model (LLM). Kedua model tersebut tersedia di chatbot Grok untuk pengguna X Premium dan X Premium+. Perusahaan mengklaim kinerjanya mengungguli model Claude 2.5 Sonnet dan GPT-4 Turbo AI.

Sumber