Trí thông minh dữ liệu tạo

Google có Mô hình AI nguồn mở mới—Nó có thể cạnh tranh với Llama-2 của Meta không? – Giải mã

Ngày:

Google AI—a division of the search giant—unveiled Đọt non today, a new family of open-source language models derived from its recently released Gemini suite of AI tools. With Gemma, Google is directly challenging the leading position of LLMs based on Meta’s LLaMa and Mistral.

Demis Hassabis, đồng sáng lập Google DeepMind, đã viết trong một báo cáo rằng: “Chúng tôi có lịch sử lâu dài trong việc hỗ trợ khoa học và nguồn mở có trách nhiệm, điều này có thể thúc đẩy tiến trình nghiên cứu nhanh chóng”. kêu riu ríu. “Vì vậy, chúng tôi tự hào giới thiệu Gemma: một bộ mô hình mở nhẹ, tốt nhất so với kích thước của chúng, lấy cảm hứng từ cùng một công nghệ được sử dụng cho Gemini.”

Gemini là LLM nguồn đóng, thương mại, đa phương thức được Google phát hành gần đây để thay thế PaLM-2 trong việc cung cấp năng lượng cho bộ dịch vụ trực tuyến của mình, cạnh tranh trực tiếp với ChatGPT Plus của OpenAI.

Gemma có sẵn trong hai phiên bản: Đá quý 2B, một mô hình nhẹ được đào tạo trên hai tỷ tham số được tối ưu hóa để đạt hiệu quả và có thể chạy trên nhiều phần cứng hơn, và Đá quý 7B, một mô hình mạnh mẽ hơn được đào tạo trên 7 tỷ tham số, mang lại kết quả tốt hơn nhưng đòi hỏi nhiều sức mạnh tính toán hơn.

“Tại Google, chúng tôi tin vào việc làm cho AI trở nên hữu ích cho mọi người,” Google cho biết trong một tuyên bố. thông báo chính thức, nhấn mạnh tầm nhìn dân chủ hóa công nghệ AI.

Việc phát hành mô hình nguồn mở có thể tác động ngay lập tức hơn đến các nhà phát triển AI và kỹ sư phần mềm, nhưng lợi ích sẽ đến với người dùng cuối sau khi họ đã được thử nghiệm, tinh chỉnh và tích hợp vào các sản phẩm và dịch vụ.

Công ty cho biết thêm: “Khi chúng tôi tiếp tục mở rộng dòng sản phẩm Gemma, chúng tôi mong muốn giới thiệu các biến thể mới cho các ứng dụng đa dạng”.

Thông báo của Google đề cập đến các nền tảng kỹ thuật và triết học của Gemma, cho biết mô hình này “được thiết kế với các Nguyên tắc AI của chúng tôi đặt lên hàng đầu”.

“Để hiểu và giảm thiểu rủi ro cho các mô hình Gemma, chúng tôi đã tiến hành đánh giá mạnh mẽ bao gồm lập nhóm đỏ thủ công, thử nghiệm đối thủ tự động và đánh giá khả năng của mô hình đối với các hoạt động nguy hiểm,” nó cho biết.

Ngay sau khi phát hành, Gemma đã nhanh chóng leo lên thứ hạng trên bảng xếp hạng Ôm Mặt thường được nhắc đến, đạt vị trí thứ hai trong bảng xếp hạng. danh sách xu hướng và đánh bại tất cả các mô hình AI và LLM mã nguồn mở khác—ngoại trừ Open Cascade của Stability AI, một AI tạo ra văn bản thành hình ảnh mới.

Những con số thực chứng minh sức mạnh đã được tuyên bố của Gemma: nó đã chứng tỏ hiệu suất vượt trội so với LlaMa-2 của Meta trên một số điểm chuẩn tổng hợp. Ví dụ, Gemma vượt trội hơn LlaMa-2 trong các bài kiểm tra như MMLU (kiến thức bao trùm 57 ngành khoa học), Hellaswag (đánh giá khả năng suy luận cơ bản trong công việc hàng ngày), MATH (đánh giá năng lực toán học) và HumanEval (kiểm tra trình độ mã hóa). 

Hình ảnh: Google

Các nhà phát triển quan tâm đến việc thử nghiệm Gemma có thể làm điều đó miễn phí bằng cách sử dụng Kaggle, một nền tảng khoa học dữ liệu và trí tuệ nhân tạo do Google xây dựng. Công ty cũng đã cung cấp Gemma thông qua google colab sổ ghi chép và đang tặng khoản tín dụng 300 đô la cho người dùng Google Cloud lần đầu.

Google cho biết: “Các nhà nghiên cứu cũng có thể đăng ký khoản tín dụng Google Cloud lên tới 500,000 USD để đẩy nhanh các dự án của họ”.

Sửa bởi Ryan Ozawa.

Luôn cập nhật tin tức về tiền điện tử, cập nhật hàng ngày trong hộp thư đến của bạn.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img