生成数据智能

Meta 推出 Llama-3——我们测试新的顶级开源 AI 模型 – Decrypt

日期:

Meta 发布了 Llama 3,这是目前最先进的开源大语言模型。它建立在其前身 Llama 2 奠定的基础上,考虑到有传言称,它令人惊讶 该版本将于下个月发布.

凭借其开源根源,Llama-2 在并行开发其他强大模型(例如 混合、羊驼毛、骆马毛和 WizardLM。现在,Llama-3 承诺进一步发挥这些功能,提供与 OpenAI 当前旗舰 AI 模型 GPT-4 相当的功能。

赞扬周四的发布 作为“我们最先进的开源大语言模型的下一代。”这家科技巨头对其能力充满信心,Llama 3 正在为其提供动力 元人工智能,这又被添加到公司几乎所有的 广泛流行的应用程序:Instagram、Facebook 和 WhatsApp。它已在某些国家/地区提供,但其他地区的用户可以通过 VPN 访问它。

Meta AI 的 Chatbot 界面与 ChatGPT Plus 相当,而且免费。

“我们正在使用最先进的新 Llama 3 AI 模型升级 Meta AI,该模型已开源,”马克·扎克伯格 说过 在 Facebook 帖子中。 “通过这个新模型,我们相信 Meta AI 现在是您可以自由使用的最智能的人工智能助手。”

解码 能够测试新的人工智能,发现它与 ChatGPT-Plus 一样强大,无需付费订阅。它可以生成图像和动画、生成代码并提供连贯的、上下文相关的响应。新的聊天机器人也可以访问互联网,但它仍然无法与 Perplexity 等专业解决方案的功能相媲美。

也许唯一的缺点是 Llama-3 当前的上下文窗口仅限于 8K 个标记——大约 6,000 个单词。

Meta 确实发布了一个 70 亿参数的 Llama-3 模型,但使用它需要大量的计算能力——可能是一整架 GPU。根据综合基准测试,该模型击败了 Gemini 1.5 Pro 和 Claude 3 Sonnet。

还有一个 8 亿参数模型可用,可以在消费级 GPU 上本地运行。它在各种综合基准测试中击败了 Google 的 Gemma 和 Mistral 7B。该模型尚未在 LLM Arena 中列出,因此尚未报告主观 ELO 分数。

Llama 3 与其他 AI 法学硕士
图片:元

这两种模型还可以以更低的成本在云实例中运行。

“我们致力于以负责任的方式开发 Llama 3,并且我们提供各种资源来帮助其他人也负责任地使用它,”Meta 表示。这包括引入新的信任和安全工具,例如 Llama Guard 2、Code Shield 和 Cyber​​Sec Eval 2。

Meta 表示,在接下来的几个月中,它计划推出新功能、更长的上下文窗口、额外的模型大小和增强的性能。 Llama 3 研究论文也将被分享。

“采用 Llama 3 技术构建的 Meta AI 现在是世界领先的人工智能助手之一,可以提高您的智力并减轻您的负担,帮助您学习、完成工作、创建内容和连接,以充分利用每一刻,”梅塔说。

Meta 补充说,它还在训练一个包含 400 亿个参数的大规模模型,预计将于今年晚些时候发布。该模型(可能与 Claude Opus 或最新版本的 GPT-4.5 相当)可能是迄今为止最强大的开源模型。如果历史重演,它也将成为新一代微调模型的基础,这些模型将在整体质量上击败 Llama-3,并将促进与领先的闭源模型的竞争。

骑着骆驼

解码 在 Meta AI 内部测试了 Llama-3,看看它是否像 Zuck 所说的那么好。简而言之,Llama-3 引入了许多值得注意的特性和功能,应该成为开源社区可以迭代的一个伟大的基础模型。

内容审核

Llama-3 表现出了对内容审核的坚定承诺。即使面对常见的越狱技术,它始终拒绝生成有害的种族内容。

例如,当模特被要求提供如何引诱女性的说明时,它提供了通用但有用的答案。然而,当被问及如何勾引最好朋友的妻子时,该模特坚决拒绝提供答案。

图像和动画

与 ChatGPT-Plus 类似,Meta AI with Llama-3 能够生成图像。然而,它通过提供动画选项使此功能更进一步,这是 ChatGPT 或 Gemini 中不提供的功能。

Meta AI 使用 Llama-3 生成的图像比 Dalle-3 生成的图像更真实,但它们达不到 Google 即将推出的 ImageFX 生成的图像质量。

编码能力

Llama-3 已被证明在编码方面非常熟练。当提出一个独特且难以解释的游戏想法时,该模型能够在两次尝试中生成必要的 Python 代码,从而生成一个功能性游戏。第一个镜头让我们大致了解了如何创建游戏,但在我们明确需要用 Python 编写它之后,它创建了工作代码。

游戏功能正常,但遗漏了一些小细节,例如玩家获胜后重新启动。不过,其他聊天机器人也发生了同样的情况。

我们发现 Claude 3 Sonnet 是完成此任务的最佳工具,其次是 Llama 3。GPT-4 跌至第三位。然而,不同的用户可能会得到不同的结果。

这里是一个 引擎收录 包含 Llama3、Claude 和 ChatGPT 生成的源代码,供有兴趣测试它们的人使用。

政治中立

该模型的目标是政治中立,这一点从它对资本主义和共产主义问题的回应中可以看出。答复在结构上相似,提供了每个系统的介绍、优点和缺点。

在回答“什么是男人?”等问题时也观察到了这种中立模式。和“女人是什么?”

尽管如此,它的反应还是有点亲资本主义和左倾,这并不奇怪,因为它是最 共同的政治倾向 在大型语言模型中。

逻辑推理

Llama-3表现出了强大的逻辑推理能力。当使用经常让用户感到困惑的复杂 LSAT 问题进行测试时,该模型不仅提供了正确的答案,而且还提供了清晰合理的解释。

长提示限制

尽管 Llama-3 有很多优点,但它在长提示方面遇到了困难。当出现大约一页半的上下文的冗长提示时(可由 GPT-4、Claude 或 Mistral 等模型摄取),模型返回一条错误消息。

语言理解

该模型展示了对不同语言的深刻理解。当被要求翻译西班牙语口号时,它不仅提供了准确的翻译,还提供了上下文以更好地理解该口号。

结论

作为聊天机器人界面,Meta AI(由 Llama3 提供支持)可以与 ChatGPT Plus 竞争,总体来说是一个不错的选择。

在更技术层面上,LLama3 作为 LLM 足以在不同场景下与 GPT-4 竞争,只是在 token 上下文功能和检索增强生成(基本上是从用户提供的特定数据集中提取信息)方面输了。这对于精通技术的用户来说可能很重要,但对于普通人来说可能没什么大不了的。

如果您主要使用 ChatGPT 通过 Dall-E 生成图像,您可能需要考虑取消订阅,因为 Llama-3 的图像和动画生成功能是相当的。但是,如果您还需要支持长提示,Llama-3 可能不是您的最佳选择,您可能需要考虑坚持使用 ChatGPT-Plus。

偶尔的用户可能会发现 Llama-3 无需付费会员即可满足他们的需求。

对于需要大量互联网研究的任务,ChatGPT Plus 或 Perplexity 可能更合适。

最后,如果您的重点是编码,Llama-3 可能是一个不错的选择,尽管还有其他专用工具可用。 Llama-3 是免费的这一事实是一个显着的优势。

编辑 小泽赖恩.

随时了解加密新闻,在您的收件箱中获取每日更新。

现货图片

最新情报

现货图片

在线答疑

你好呀! 我怎么帮你?