Gemini 1.5 Flash-8B dengan biaya nominal terendah di antara keluarga Gemini kini tersedia

Gemini 1.5 Flash-8B, anggota terbaru dari keluarga model kecerdasan buatan (AI) Gemini, kini tersedia secara umum untuk penggunaan produksi. Google pada hari Kamis mengumumkan ketersediaan umum model tersebut, menyoroti bahwa ini adalah versi Gemini 1.5 Flash yang lebih kecil dan lebih cepat yang diperkenalkan di Google I/O. Karena cepat, ia memiliki latensi rendah dan menghasilkan keluaran yang lebih efisien. Lebih penting lagi, raksasa teknologi tersebut menyatakan bahwa model AI Flash-8B adalah “biaya per kecerdasan terendah dibandingkan model Gemini mana pun.”

Gemini 1.5 Flash-8B sekarang tersedia secara umum

Di pengembang Entri blograksasa teknologi yang berbasis di Mountain View merinci model kecerdasan buatan barunya. Gemini 1.5 Flash-8B berasal dari model Gemini 1.5 Flash AI, yang berfokus pada pemrosesan yang lebih cepat dan menghasilkan keluaran yang lebih efisien. Perusahaan sekarang mengklaim bahwa Google DeepMind telah mengembangkan versi model AI yang lebih kecil dan lebih cepat dalam beberapa bulan terakhir.

Meskipun merupakan model yang lebih kecil, raksasa teknologi ini mengklaim bahwa kinerjanya “hampir menyamai” model 1,5 Flash di berbagai tolok ukur. Beberapa fitur tersebut mencakup obrolan, transkripsi, dan terjemahan bahasa konteks panjang.

Salah satu keunggulan utama model AI adalah efektivitas harganya. Google mengatakan Gemini 1.5 Flash-8B akan menawarkan harga nominal terendah di keluarga Gemini. Pengembang harus membayar $0,15 (sekitar Rs 12,5) per juta token keluaran, $0,0375 (sekitar Rs 3) per juta token masukan, dan $0,01 (sekitar Rs 0,8) per juta token pada klaim yang disimpan dalam cache.

Selain itu, Google menggandakan batas kecepatan untuk model AI 1.5 Flash-8B. Kini, pengembang dapat mengirimkan hingga 4.000 permintaan per menit (RPM) saat menggunakan model ini. Menjelaskan keputusan tersebut, raksasa teknologi tersebut menyatakan bahwa model tersebut cocok untuk tugas-tugas sederhana dan bervolume tinggi. Pengembang yang ingin mencoba model ini dapat melakukannya melalui Google AI Studio dan Gemini API secara gratis.

Sumber