Meta 推出 Llama-3——我们对新的顶级开源 AI 模型进行了测试 - 解密

Meta 发布了 Llama 3，这是目前最先进的开源大语言模型。它建立在其前身 Llama 2 奠定的基础上，考虑到有传言称，它令人惊讶该版本将于下个月发布.

凭借其开源根源，Llama-2 在并行开发其他强大模型（例如混合、羊驼毛、骆马毛和 WizardLM。现在，Llama-3 承诺进一步发挥这些功能，提供与 OpenAI 当前旗舰 AI 模型 GPT-4 相当的功能。

元赞扬周四的发布作为“我们最先进的开源大语言模型的下一代。”这家科技巨头对其能力充满信心，Llama 3 正在为其提供动力元人工智能，这又被添加到公司几乎所有的广泛流行的应用程序：Instagram、Facebook 和 WhatsApp。它已在某些国家/地区提供，但其他地区的用户可以通过 VPN 访问它。

Meta AI 的 Chatbot 界面与 ChatGPT Plus 相当，而且免费。

“我们正在使用最先进的新 Llama 3 AI 模型升级 Meta AI，该模型已开源，”马克·扎克伯格说过在 Facebook 帖子中。 “通过这个新模型，我们相信 Meta AI 现在是您可以自由使用的最智能的人工智能助手。”

解码能够测试新的人工智能，发现它与 ChatGPT-Plus 一样强大，无需付费订阅。它可以生成图像和动画、生成代码并提供连贯的、上下文相关的响应。新的聊天机器人也可以访问互联网，但它仍然无法与 Perplexity 等专业解决方案的功能相媲美。

也许唯一的缺点是 Llama-3 当前的上下文窗口仅限于 8K 个标记——大约 6,000 个单词。

Meta 确实发布了一个 70 亿参数的 Llama-3 模型，但使用它需要大量的计算能力——可能是一整架 GPU。根据综合基准测试，该模型击败了 Gemini 1.5 Pro 和 Claude 3 Sonnet。

还有一个 8 亿参数模型可用，可以在消费级 GPU 上本地运行。它在各种综合基准测试中击败了 Google 的 Gemma 和 Mistral 7B。该模型尚未在 LLM Arena 中列出，因此尚未报告主观 ELO 分数。

这两种模型还可以以更低的成本在云实例中运行。

“我们致力于以负责任的方式开发 Llama 3，并且我们提供各种资源来帮助其他人也负责任地使用它，”Meta 表示。这包括引入新的信任和安全工具，例如 Llama Guard 2、Code Shield 和 CyberSec Eval 2。

Meta 表示，在接下来的几个月中，它计划推出新功能、更长的上下文窗口、额外的模型大小和增强的性能。 Llama 3 研究论文也将被分享。

“采用 Llama 3 技术构建的 Meta AI 现在是世界领先的人工智能助手之一，可以提高您的智力并减轻您的负担，帮助您学习、完成工作、创建内容和连接，以充分利用每一刻，”梅塔说。

Meta 补充说，它还在训练一个包含 400 亿个参数的大规模模型，预计将于今年晚些时候发布。该模型（可能与 Claude Opus 或最新版本的 GPT-4.5 相当）可能是迄今为止最强大的开源模型。如果历史重演，它也将成为新一代微调模型的基础，这些模型将在整体质量上击败 Llama-3，并将促进与领先的闭源模型的竞争。

骑着骆驼

解码在 Meta AI 内部测试了 Llama-3，看看它是否像 Zuck 所说的那么好。简而言之，Llama-3 引入了许多值得注意的特性和功能，应该成为开源社区可以迭代的一个伟大的基础模型。

内容审核

Llama-3 表现出了对内容审核的坚定承诺。即使面对常见的越狱技术，它始终拒绝生成有害的种族内容。

例如，当模特被要求提供如何引诱女性的说明时，它提供了通用但有用的答案。然而，当被问及如何勾引最好朋友的妻子时，该模特坚决拒绝提供答案。

图像和动画

与 ChatGPT-Plus 类似，Meta AI with Llama-3 能够生成图像。然而，它通过提供动画选项使此功能更进一步，这是 ChatGPT 或 Gemini 中不提供的功能。

Meta AI 使用 Llama-3 生成的图像比 Dalle-3 生成的图像更真实，但它们达不到 Google 即将推出的 ImageFX 生成的图像质量。

编码能力

Llama-3 已被证明在编码方面非常熟练。当提出一个独特且难以解释的游戏想法时，该模型能够在两次尝试中生成必要的 Python 代码，从而生成一个功能性游戏。第一个镜头让我们大致了解了如何创建游戏，但在我们明确需要用 Python 编写它之后，它创建了工作代码。

游戏功能正常，但遗漏了一些小细节，例如玩家获胜后重新启动。不过，其他聊天机器人也发生了同样的情况。

我们发现 Claude 3 Sonnet 是完成此任务的最佳工具，其次是 Llama 3。GPT-4 跌至第三位。然而，不同的用户可能会得到不同的结果。

这里是一个引擎收录包含 Llama3、Claude 和 ChatGPT 生成的源代码，供有兴趣测试它们的人使用。

政治中立

该模型的目标是政治中立，这一点从它对资本主义和共产主义问题的回应中可以看出。答复在结构上相似，提供了每个系统的介绍、优点和缺点。

在回答“什么是男人？”等问题时也观察到了这种中立模式。和“女人是什么？”

尽管如此，它的反应还是有点亲资本主义和左倾，这并不奇怪，因为它是最共同的政治倾向在大型语言模型中。

逻辑推理

Llama-3表现出了强大的逻辑推理能力。当使用经常让用户感到困惑的复杂 LSAT 问题进行测试时，该模型不仅提供了正确的答案，而且还提供了清晰合理的解释。

长提示限制

尽管 Llama-3 有很多优点，但它在长提示方面遇到了困难。当出现大约一页半的上下文的冗长提示时（可由 GPT-4、Claude 或 Mistral 等模型摄取），模型返回一条错误消息。

语言理解

该模型展示了对不同语言的深刻理解。当被要求翻译西班牙语口号时，它不仅提供了准确的翻译，还提供了上下文以更好地理解该口号。

结论

作为聊天机器人界面，Meta AI（由 Llama3 提供支持）可以与 ChatGPT Plus 竞争，总体来说是一个不错的选择。

在更技术层面上，LLama3 作为 LLM 足以在不同场景下与 GPT-4 竞争，只是在 token 上下文功能和检索增强生成（基本上是从用户提供的特定数据集中提取信息）方面输了。这对于精通技术的用户来说可能很重要，但对于普通人来说可能没什么大不了的。

如果您主要使用 ChatGPT 通过 Dall-E 生成图像，您可能需要考虑取消订阅，因为 Llama-3 的图像和动画生成功能是相当的。但是，如果您还需要支持长提示，Llama-3 可能不是您的最佳选择，您可能需要考虑坚持使用 ChatGPT-Plus。

偶尔的用户可能会发现 Llama-3 无需付费会员即可满足他们的需求。

对于需要大量互联网研究的任务，ChatGPT Plus 或 Perplexity 可能更合适。

最后，如果您的重点是编码，Llama-3 可能是一个不错的选择，尽管还有其他专用工具可用。 Llama-3 是免费的这一事实是一个显着的优势。

编辑小泽赖恩.

随时了解加密新闻，在您的收件箱中获取每日更新。

SEO 支持的内容和 PR 分发。今天得到放大。
PlatoData.Network 垂直生成人工智能。赋予自己力量。访问这里。
柏拉图爱流。 Web3 智能。知识放大。访问这里。
柏拉图ESG。碳，清洁科技, 能源，环境，太阳能，废物管理。访问这里。
柏拉图健康。生物技术和临床试验情报。访问这里。
Sumber: https://decrypt.co/227263/meta-llama-3-open-source-ai-llm-review

生成数据智能

Meta 推出 Llama-3——我们测试新的顶级开源 AI 模型 – Decrypt

骑着骆驼

结论

随时了解加密新闻，在您的收件箱中获取每日更新。

以太坊回来了吗？创纪录的 267,000 名新用户引发猜测

Metabirkin NFT 进入斯德哥尔摩博物馆 – CryptoInfoNet

最新情报

前 DFS 监管机构为由 Winklevoss Twins 和 Robert Leshner 支持的加密货币风险基金筹集了 5.1 万美元 – CryptoInfoNet

比特币现金分析：BCH 面临 462 美元的艰巨任务 |实时比特币新闻

如果以太坊价格能够收复 100 SMA，它可能会反弹

随着 Wasabi 钱包的退出，Trezor 将终止增强隐私的混币功能

为什么人工智能无法拯救无法玩的 Web 3.0 游戏 – The Daily Hodl

比特币模仿 2016 年模式：分析师认为价格下跌可能是暂时的 pen_spark

在线答疑