Nvidia memperkenalkan model AI NVLM 1.0 barunya, yang bersaing dengan OpenAI GPT-4

Nvidia telah merilis model AI open source yang kuat yang dapat mengungguli OpenAI GPT-4.

Rangkaian NVLM 1.0 baru dari model bahasa besar multimodal (LLM) sumber terbuka, dengan model andalannya, NVLM-D-72B, berisi sekitar 72 miliar parameter.

Menurut tim peneliti Nvidia, model AI baru ini unggul dalam tugas-tugas bahasa visual sambil mempertahankan dan bahkan meningkatkan kinerja hanya teks dibandingkan dengan tulang punggung LLM. di dalam kertas“Kami memperkenalkan NVLM 1.0, rangkaian model bahasa multimodal besar tingkat pertama yang mencapai hasil tercanggih dalam tugas-tugas bahasa visual, bersaing dengan model kepemilikan terkemuka (misalnya, GPT-4o) dan model akses terbuka,” kata peneliti.

Tidak seperti beberapa model kepemilikan lainnya yang mengalami penurunan kinerja teks secara signifikan dari waktu ke waktu, NVLM-D-72B dilaporkan meningkatkan akurasinya rata-rata 4,3 poin di seluruh tolok ukur teks utama.

LLM juga mampu menafsirkan grafik dan tabel, menganalisis gambar, memahami meme, membuat kode program, serta memecahkan masalah matematika. Bobot model tersedia untuk umum di Hugging Face dan Nvidia mengatakan pada akhirnya akan merilis kode pelatihan.

Apa pendapat komunitas AI tentang model NVLM Nvidia?

Peneliti AI di Seorang pengguna menulis: “Luar biasa! Nvidia baru saja menerbitkan model 72B dan setara dengan llama 3.1 405B dalam evaluasi matematika dan pemrograman serta memiliki visibilitas juga?

Namun Nvidia sendiri disebut-sebut telah menggunakan sumber daya open source untuk mengembangkan NVLM 1.0, memperoleh wawasan dari model AI lain dan berbagai data pelatihan. Namun, model NVLM-D-72B dibatasi oleh ketentuan lisensinya. Ini tidak boleh digunakan untuk tujuan komersial atau dimodifikasi untuk dijual kembali. Pada dasarnya, Nvidia menyediakan model tersebut secara eksklusif untuk tujuan penelitian dan untuk penghobi yang ingin menguji batas kartu grafis kelas atas mereka.

Oleh karena itu, penggunaan istilah “terbuka” oleh para peneliti sepenuhnya disengaja. Meskipun temuan Nvidia memberikan nilai, pembatasan penggunaan komersial berarti bahwa temuan tersebut tidak dapat dianggap benar-benar open source, yang memerlukan kebebasan untuk menggunakan, memodifikasi, dan mendistribusikan model tanpa batasan apa pun.

ReadWrite telah menghubungi Nvidia untuk memberikan komentar.

Gambar unggulan: Di tengah penerbangan

Pos Nvidia memperkenalkan model AI NVLM 1.0 barunya, yang bersaing dengan OpenAI GPT-4 muncul pertama kali di ReadWrite.



Sumber