Trí thông minh dữ liệu tạo

Meta tiết lộ Llama-3—Chúng tôi đưa mô hình AI nguồn mở hàng đầu mới vào thử nghiệm – Giải mã

Ngày:

Meta has released of Llama 3, the most advanced open source large language model currently available. It builds upon the foundation laid by its predecessor, Llama 2, and came as a surprise considering that rumors suggested that the release would happen next month.

With its open-source roots, Llama-2 was instrumental in the concurrent development of other powerful models such as Hỗn hợp, Alpaca, Vicuna, and WizardLM. Now, Llama-3 promises to take these capabilities even further, offering functionalities comparable to those of OpenAI’s current flagship AI model GPT-4.

Siêu dữ liệu hailed Thursday’s release as “the next generation of our state-of-the-art open source large language model.” So confident is the tech giant in its capabilities, Llama 3 is powering Mục tiêu AI, which in turn was added to almost all of the company’s massively popular apps: Instagram, Facebook, and WhatsApp. It has been made available in select countries, but users in other regions could access it via VPN.

Giao diện Chatbot của Meta AI có thể so sánh với ChatGPT Plus—và hoàn toàn miễn phí.

“We’re upgrading Meta AI with our new state-of-the-art Llama 3 AI model, which we’re open sourcing,” Mark Zuckerberg nói in a Facebook post. “With this new model, we believe Meta AI is now the most intelligent AI assistant that you can freely use.”

Giải mã đã có thể thử nghiệm AI mới và nhận thấy nó có khả năng tương đương ChatGPT-Plus mà không cần đăng ký trả phí. Nó có thể tạo ra hình ảnh và hoạt ảnh, tạo mã và cung cấp các phản hồi mạch lạc, phù hợp với ngữ cảnh. Chatbot mới cũng có thể truy cập internet nhưng vẫn chưa thể sánh được với khả năng của các giải pháp chuyên dụng như Perplexity.

Có lẽ nhược điểm duy nhất là cửa sổ ngữ cảnh hiện tại của Llama-3 bị giới hạn ở 8K mã thông báo —khoảng 6,000 từ.

Meta đã phát hành mô hình Llama-70 có 3 tỷ tham số, nhưng việc sử dụng nó sẽ đòi hỏi sức mạnh tính toán lớn—có thể là toàn bộ giá GPU. Theo điểm chuẩn tổng hợp, model này đánh bại Gemini 1.5 Pro và Claude 3 Sonnet.

Ngoài ra còn có sẵn một mô hình tham số 8 tỷ, có thể chạy cục bộ trên GPU cấp độ người tiêu dùng. Cái này đánh bại Gemma và Mistral 7B của Google ở ​​nhiều điểm chuẩn tổng hợp khác nhau. Mô hình này vẫn chưa được liệt kê trong LLM Arena nên chưa có điểm ELO chủ quan để báo cáo.

Llama 3 so với các LLM AI khác
Hình ảnh: Meta

Cả hai mô hình cũng có thể chạy trong phiên bản đám mây với chi phí thấp hơn.

Meta tuyên bố: “Chúng tôi tận tâm phát triển Llama 3 một cách có trách nhiệm và chúng tôi cũng đang cung cấp nhiều tài nguyên khác nhau để giúp những người khác sử dụng nó một cách có trách nhiệm”. Điều này bao gồm việc giới thiệu các công cụ an toàn và tin cậy mới như Llama Guard 2, Code Shield và CyberSec Eval 2.

Trong những tháng tới, Meta cho biết họ có kế hoạch giới thiệu các khả năng mới, cửa sổ ngữ cảnh dài hơn, kích thước mô hình bổ sung và hiệu suất nâng cao. Bài nghiên cứu về Llama 3 cũng sẽ được chia sẻ.

“Meta AI, được xây dựng bằng công nghệ Llama 3, hiện là một trong những trợ lý AI hàng đầu thế giới có thể tăng cường trí thông minh và giảm bớt gánh nặng cho bạn—giúp bạn học hỏi, hoàn thành công việc, tạo nội dung và kết nối để tận dụng tối đa mọi khoảnh khắc ,” Meta nói.

Meta nói thêm rằng họ cũng đang đào tạo một mô hình tham số khổng lồ 400 tỷ, dự kiến ​​sẽ được phát hành vào cuối năm nay. Mô hình này—có thể so sánh với Claude Opus hoặc phiên bản mới nhất của GPT-4.5— có thể là mô hình nguồn mở mạnh mẽ nhất cho đến nay. Nếu Lịch sử lặp lại, nó cũng sẽ đóng vai trò là cơ sở cho một thế hệ mô hình được tinh chỉnh mới sẽ đánh bại Llama-3 về chất lượng tổng thể—và sẽ thúc đẩy sự cạnh tranh với các mô hình nguồn gần hàng đầu.

Cưỡi Llama

Giải mã đã thử nghiệm Llama-3 bên trong Meta AI để xem liệu nó có tốt như Zuck nói hay không. Nói tóm lại, Llama-3 đã giới thiệu một số tính năng và khả năng đáng chú ý và sẽ là một mô hình nền tảng tuyệt vời mà cộng đồng nguồn mở có thể lặp lại.

Kiểm duyệt nội dung

Llama-3 thể hiện cam kết mạnh mẽ về việc kiểm duyệt nội dung. Nó liên tục từ chối tạo ra nội dung có hại về chủng tộc, ngay cả khi phải đối mặt với các kỹ thuật bẻ khóa thông thường.

Ví dụ: khi người mẫu được yêu cầu hướng dẫn cách quyến rũ một phụ nữ, nó sẽ đưa ra những câu trả lời chung chung nhưng hữu ích. Tuy nhiên, khi được yêu cầu hướng dẫn cách dụ dỗ vợ bạn thân, người mẫu kiên quyết từ chối đưa ra câu trả lời.

Hình ảnh và hoạt hình

Tương tự như ChatGPT-Plus, Meta AI với Llama-3 có khả năng tạo hình ảnh. Tuy nhiên, khả năng này phải tiến thêm một bước nữa bằng cách cung cấp tùy chọn tạo hoạt ảnh cho chúng—một tính năng không có trong ChatGPT hoặc Gemini.

Hình ảnh do Meta AI tạo ra với Llama-3 thực tế hơn so với hình ảnh do Dalle-3 tạo ra, nhưng chúng không đạt chất lượng hình ảnh do ImageFX sắp ra mắt của Google tạo ra.

Khả năng mã hóa

Llama-3 đã được chứng minh là rất thành thạo về mã hóa. Khi trình bày một ý tưởng trò chơi độc đáo và được giải thích kém, mô hình này có thể tạo ra mã Python cần thiết trong hai lần thử, tạo ra một trò chơi hoạt động được. Cảnh quay đầu tiên đã cho chúng tôi ý tưởng sơ bộ về cách tạo trò chơi, nhưng nó đã tạo ra mã hoạt động được sau khi chúng tôi làm rõ rằng chúng tôi cần nó bằng Python.

Trò chơi vẫn hoạt động nhưng thiếu một số chi tiết nhỏ, chẳng hạn như khởi động lại sau khi người chơi thắng. Tuy nhiên, điều tương tự cũng xảy ra với các chatbot khác.

Chúng tôi nhận thấy Claude 3 Sonnet là công cụ tốt nhất cho nhiệm vụ này, tiếp theo là Llama 3. GPT-4 rơi xuống vị trí thứ ba. Tuy nhiên, những người dùng khác nhau có thể nhận được kết quả khác nhau.

Dưới đây là một pastebin with the source codes generated by Llama3, Claude, and ChatGPT for those interested in testing them out.

Trung lập chính trị

Mô hình này hướng tới tính trung lập về chính trị, được chứng minh bằng phản ứng của nó đối với các câu hỏi về chủ nghĩa tư bản và chủ nghĩa cộng sản. Các câu trả lời có cấu trúc tương tự nhau, cung cấp phần giới thiệu, ưu và nhược điểm cho từng hệ thống.

Kiểu trung lập này cũng được quan sát thấy khi trả lời các câu hỏi như “Đàn ông là gì?” và “Phụ nữ là gì?”

Still, its responses are slightly pro-capitalism and left-leaning, which is unsurprising as it’s the most common political tendency among large language models.

Lý luận hợp lý

Llama-3 đã thể hiện khả năng suy luận logic mạnh mẽ. Khi thử nghiệm với các câu hỏi LSAT phức tạp thường gây nhầm lẫn cho người dùng, mô hình không chỉ đưa ra câu trả lời đúng mà còn đưa ra lời giải thích rõ ràng và hợp lý.

Giới hạn nhắc nhở dài hạn

Mặc dù có nhiều điểm mạnh nhưng Llama-3 vẫn gặp khó khăn với những lời nhắc dài dòng. Khi được hiển thị với một lời nhắc dài khoảng một trang rưỡi ngữ cảnh — có thể được các mô hình như GPT-4, Claude hoặc Mistral nhập vào — mô hình trả về một thông báo lỗi.

Hiểu ngôn ngữ

Mô hình này thể hiện sự hiểu biết sâu sắc về các ngôn ngữ khác nhau. Khi được yêu cầu dịch một khẩu hiệu bằng tiếng Tây Ban Nha, nó không chỉ cung cấp bản dịch chính xác mà còn cung cấp ngữ cảnh để hiểu rõ hơn về khẩu hiệu đó.

Kết luận

Là một giao diện chatbot, Meta AI (được cung cấp bởi Llama3) có thể cạnh tranh với ChatGPT Plus và là một lựa chọn tuyệt vời về tổng thể.

Ở cấp độ kỹ thuật hơn, LLama3 với tư cách là LLM đủ tốt để cạnh tranh với GPT-4 trong các tình huống khác nhau, chỉ thua về khả năng bối cảnh mã thông báo và Thế hệ tăng cường truy xuất (về cơ bản là lấy thông tin từ một tập dữ liệu cụ thể do người dùng cung cấp). Điều này có thể quan trọng đối với người dùng am hiểu công nghệ, nhưng có thể không phải là vấn đề lớn đối với người thường.

Nếu bạn chủ yếu sử dụng ChatGPT để tạo hình ảnh bằng Dall-E, bạn có thể cân nhắc việc hủy đăng ký của mình vì khả năng tạo hình ảnh và hoạt ảnh của Llama-3 là tương đương nhau. Tuy nhiên, nếu bạn cũng cần hỗ trợ cho những lời nhắc dài, Llama-3 có thể không phải là lựa chọn tốt nhất cho bạn và bạn có thể cân nhắc gắn bó với ChatGPT-Plus.

Người dùng không thường xuyên có thể thấy rằng Llama-3 đáp ứng nhu cầu của họ mà không yêu cầu tư cách thành viên trả phí.

Đối với những công việc đòi hỏi phải nghiên cứu nhiều trên Internet, ChatGPT Plus hoặc Perplexity có thể phù hợp hơn.

Cuối cùng, nếu bạn tập trung vào mã hóa, Llama-3 có thể là một lựa chọn thay thế tốt, mặc dù có sẵn các công cụ chuyên dụng khác. Việc Llama-3 miễn phí là một lợi thế đáng kể.

Sửa bởi Ryan Ozawa.

Luôn cập nhật tin tức về tiền điện tử, cập nhật hàng ngày trong hộp thư đến của bạn.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?