Kecerdasan Data Generatif

Google Punya Model AI Sumber Terbuka Baru—Bisakah Bersaing Dengan Llama-2 Meta? – Dekripsi

Tanggal:

Google AI—a division of the search giant—unveiled Gemma today, a new family of open-source language models derived from its recently released Gemini suite of AI tools. With Gemma, Google is directly challenging the leading position of LLMs based on Meta’s LLaMa and Mistral.

“Kami memiliki sejarah panjang dalam mendukung open source dan sains yang bertanggung jawab, yang dapat mendorong kemajuan penelitian yang pesat,” tulis Demis Hassabis, salah satu pendiri Google DeepMind, dalam sebuah pernyataan. menciak. “Jadi kami bangga merilis Gemma: serangkaian model terbuka yang ringan, terbaik di kelasnya untuk ukurannya, terinspirasi oleh teknologi yang sama yang digunakan untuk Gemini.”

Gemini adalah LLM multimodal sumber tertutup, komersial baru-baru ini dirilis oleh Google untuk menggantikan PaLM-2 dalam mendukung rangkaian layanan online, bersaing langsung dengan ChatGPT Plus OpenAI.

Gemma tersedia dalam dua versi: Permata 2B, model ringan yang dilatih pada dua miliar parameter yang dioptimalkan untuk efisiensi dan dapat dijalankan di spektrum perangkat keras yang lebih luas, dan Permata 7B, model yang lebih tangguh yang dilatih pada 7 miliar parameter, yang memberikan hasil lebih baik tetapi memerlukan daya komputasi lebih besar.

“Di Google, kami percaya bahwa AI dapat bermanfaat bagi semua orang,” kata Google dalam sebuah pernyataan pengumuman resmi, menekankan visinya untuk mendemokratisasi teknologi AI.

Meluncurkan model sumber terbuka mungkin akan memberikan dampak yang lebih langsung kepada pengembang AI dan insinyur perangkat lunak, namun manfaatnya akan dirasakan oleh pengguna akhir setelah mereka diuji, disesuaikan, dan diintegrasikan ke dalam produk dan layanan.

“Seiring dengan kami terus memperluas rangkaian model Gemma, kami berharap dapat memperkenalkan varian baru untuk beragam aplikasi,” tambah perusahaan.

Pengumuman Google mencakup landasan teknis dan filosofis Gemma, dengan mengatakan bahwa model tersebut “dirancang dengan Prinsip AI kami sebagai yang terdepan.”

“Untuk memahami dan mengurangi profil risiko model Gemma, kami melakukan evaluasi yang kuat termasuk tim merah manual, pengujian permusuhan otomatis, dan penilaian kemampuan model untuk aktivitas berbahaya,” katanya.

Tak lama setelah dirilis, Gemma dengan cepat naik peringkat di papan peringkat Hugging Face yang sering direferensikan, mencapai posisi kedua di peringkat daftar tren dan mengalahkan semua model LLM dan AI open source lainnya—kecuali Open Cascade dari Stability AI, AI generatif teks-ke-gambar yang baru.

Angka-angka nyata mendukung klaim kehebatan Gemma: ia telah menunjukkan kinerja yang unggul dibandingkan LlaMa-2 Meta di beberapa tolok ukur sintetis. Misalnya, Gemma mengungguli LlaMa-2 dalam tes seperti MMLU (pengetahuan yang mencakup 57 disiplin ilmu), Hellaswag (mengevaluasi penalaran dasar dalam tugas sehari-hari), MATH (menilai kemampuan matematika), dan HumanEval (menguji kemahiran pengkodean). 

Gambar: Google

Pengembang yang tertarik untuk menguji Gemma dapat melakukannya secara gratis Kaggle, platform ilmu data dan kecerdasan buatan yang dibuat oleh Google. Perusahaan juga menyediakan Gemma melalui google colab notebook, dan memberikan kredit sebesar $300 untuk pengguna Google Cloud pertama kali.

“Para peneliti juga dapat mengajukan kredit Google Cloud hingga $500,000 untuk mempercepat proyek mereka,” kata Google.

Diedit oleh Ryan Ozawa.

Tetap di atas berita crypto, dapatkan pembaruan harian di kotak masuk Anda.

tempat_img

Intelijen Terbaru

tempat_img