生成數據智能

Meta 推出 Llama-3——我們測試新的頂級開源 AI 模型 – Decrypt

日期:

Meta has released of Llama 3, the most advanced open source large language model currently available. It builds upon the foundation laid by its predecessor, Llama 2, and came as a surprise considering that rumors suggested that the release would happen next month.

With its open-source roots, Llama-2 was instrumental in the concurrent development of other powerful models such as 混合, Alpaca, Vicuna, and WizardLM. Now, Llama-3 promises to take these capabilities even further, offering functionalities comparable to those of OpenAI’s current flagship AI model GPT-4.

Meta hailed Thursday’s release as “the next generation of our state-of-the-art open source large language model.” So confident is the tech giant in its capabilities, Llama 3 is powering 元人工智能, which in turn was added to almost all of the company’s massively popular apps: Instagram, Facebook, and WhatsApp. It has been made available in select countries, but users in other regions could access it via VPN.

Meta AI 的 Chatbot 介面與 ChatGPT Plus 相當,而且免費。

“We’re upgrading Meta AI with our new state-of-the-art Llama 3 AI model, which we’re open sourcing,” Mark Zuckerberg 說過 in a Facebook post. “With this new model, we believe Meta AI is now the most intelligent AI assistant that you can freely use.”

解碼 能夠測試新的人工智慧,發現它與 ChatGPT-Plus 一樣強大,無需付費訂閱。它可以產生圖像和動畫、生成程式碼並提供連貫的、上下文相關的回應。新的聊天機器人也可以存取互聯網,但它仍然無法與 Perplexity 等專業解決方案的功能相提並論。

也許唯一的缺點是 Llama-3 目前的上下文視窗僅限於 8K 個標記——大約 6,000 個單字。

Meta 確實發布了一個 70 億參數的 Llama-3 模型,但使用它需要大量的運算能力——可能是一整架 GPU。根據綜合基準測試,該車型擊敗了 Gemini 1.5 Pro 和 Claude 3 Sonnet。

還有一個 8 億參數模型可用,可以在消費級 GPU 上本地運行。它在各種綜合基準測試中擊敗了 Google 的 Gemma 和 Mistral 7B。該模型尚未在 LLM Arena 中列出,因此尚未報告主觀 ELO 分數。

Llama 3 與其他 AI 法學碩士
圖片:元

這兩種模型還可以以更低的成本在雲端實例中運行。

「我們致力於以負責任的方式開發 Llama 3,並且我們提供各種資源來幫助其他人也負責任地使用它,」Meta 表示。這包括引入新的信任和安全工具,例如 Llama Guard 2、Code Shield 和 Cyber​​Sec Eval 2。

Meta 表示,在接下來的幾個月中,它計劃推出新功能、更長的上下文視窗、額外的模型大小和增強的效能。 Llama 3 研究論文也將分享。

「採用 Llama 3 技術構建的 Meta AI 現在是世界領先的人工智慧助手之一,可以提高您的智力並減輕您的負擔,幫助您學習、完成工作、創建內容和連接,以充分利用每一刻,”梅塔說。

Meta 補充說,它還在訓練一個包含 400 億個參數的大規模模型,預計今年稍後發布。該模型(可能與 Claude Opus 或最新版本的 GPT-4.5 相當)可能是迄今為止最強大的開源模型。如果歷史重演,它也將成為新一代微調模型的基礎,這些模型將在整體品質上擊敗 Llama-3,並將促進與領先的閉源模型的競爭。

騎著駱駝

解碼 在 Meta AI 內部測試了 Llama-3,看看它是否像 Zuck 所說的那麼好。簡而言之,Llama-3 引入了許多值得注意的功能和功能,應該成為開源社群可以迭代的一個偉大的基礎模型。

內容審核

Llama-3 展現了對內容審核的堅定承諾。即使面對常見的越獄技術,它始終拒絕產生有害的種族內容。

例如,當模特兒被要求提供如何引誘女性的說明時,它提供了通用但有用的答案。然而,當被問及如何勾引最好朋友的妻子時,模特兒堅決拒絕提供答案。

圖像和動畫

與 ChatGPT-Plus 類似,Meta AI with Llama-3 能夠產生影像。然而,它透過提供動畫選項使此功能更進一步,這是 ChatGPT 或 Gemini 中不提供的功能。

Meta AI 使用 Llama-3 產生的影像比 Dalle-3 產生的影像更真實,但它們無法達到 Google 即將推出的 ImageFX 產生的影像品質。

編碼能力

Llama-3 已被證明在編碼方面非常熟練。當提出一個獨特且難以解釋的遊戲想法時,該模型能夠在兩次嘗試中產生必要的 Python 程式碼,從而產生一個功能性遊戲。第一個鏡頭讓我們大致了解如何創建遊戲,但在我們明確需要用 Python 編寫它之後,它創建了工作程式碼。

遊戲功能正常,但遺漏了一些小細節,例如玩家獲勝後重新啟動。不過,其他聊天機器人也發生了同樣的情況。

我們發現 Claude 3 Sonnet 是完成此任務的最佳工具,其次是 Llama 3。然而,不同的用戶可能會得到不同的結果。

這裡是一個 引擎收錄 with the source codes generated by Llama3, Claude, and ChatGPT for those interested in testing them out.

政治中立

這個模型的目標是政治中立,這一點從它對資本主義和共產主義問題的回應中可以看出。答案在結構上相似,提供了每個系統的介紹、優點和缺點。

在回答「什麼是男人?」等問題時也觀察到了這種中立模式。和“女人是什麼?”

Still, its responses are slightly pro-capitalism and left-leaning, which is unsurprising as it’s the most common political tendency among large language models.

邏輯推理

Llama-3展現了強大的邏輯推理能力。當使用經常讓使用者感到困惑的複雜 LSAT 問題進行測試時,該模型不僅提供了正確的答案,而且還提供了清晰合理的解釋。

長提示限制

儘管 Llama-3 有許多優點,但它在長提示方面遇到了困難。當出現大約一頁半的上下文的冗長提示時(可由 GPT-4、Claude 或 Mistral 等模型攝取),模型會傳回錯誤訊息。

語言理解

該模型展示了對不同語言的深刻理解。當被要求翻譯西班牙語口號時,它不僅提供了準確的翻譯,還提供了上下文以更好地理解該口號。

結論

作為聊天機器人介面,Meta AI(由 Llama3 提供支援)可以與 ChatGPT Plus 競爭,整體來說是一個不錯的選擇。

在更技術層面上,LLama3 作為 LLM 足以在不同場景下與 GPT-4 競爭,只是在 token 上下文功能和檢索增強生成(基本上是從用戶提供的特定數據集中提取資訊)方面落後。這對於精通技術的用戶來說可能很重要,但對一般人來說可能沒什麼大不了的。

如果您主要使用 ChatGPT 透過 Dall-E 產生圖像,您可能需要考慮取消訂閱,因為 Llama-3 的圖像和動畫生成功能是相當的。但是,如果您還需要支援長提示,Llama-3 可能不是您的最佳選擇,您可能需要考慮堅持使用 ChatGPT-Plus。

偶爾的用戶可能會發現 Llama-3 無需付費會員即可滿足他們的需求。

對於需要大量網路研究的任務,ChatGPT Plus 或 Perplexity 可能更合適。

最後,如果您的重點是編碼,Llama-3 可能是一個不錯的選擇,儘管還有其他專用工具可用。 Llama-3 是免費的這一事實是一個顯著的優勢。

編輯 小澤賴恩.

隨時了解加密新聞,在您的收件箱中獲取每日更新。

現貨圖片

最新情報

現貨圖片

和我們線上諮詢

你好呀!我怎麼幫你?