生成数据智能

Databricks 声称其开源 LLM 胜过 GPT-3.5

日期:

分析平台Databricks推出了开源基础大型语言模型,希望企业选择使用其工具来赶上LLM潮流。

该公司以 Apache Spark 为核心,发布了一系列基准测试,声称其通用 LLM(称为 DBRX)在语言理解、编程和数学方面击败了开源竞争对手。该开发商还声称,它在相同的指标上击败了 OpenAI 专有的 GPT-3.5。

DBRX由Mosaic AI开发, 收购 Databricks 花费 1.3 亿美元,并在 Nvidia DGX Cloud 上进行训练。 Databricks 声称它通过所谓的专家混合 (MoE) 架构优化了 DBRX 的效率,在该架构中,多个专家网络或学习者划分一个问题。

Databricks 解释说,该模型拥有 132 亿个参数,但只有 36 亿个参数在任一输入上处于活动状态。

Databricks 营销副总裁 Joel Minnick 表示 注册:“这是该模型能够高效运行且运行速度极快的一个重要原因。实际上,如果您使用当今任何类型的主要聊天机器人,您可能习惯于等待并观看答案的生成。有了 DBRX,这几乎是瞬时的。”

但模型本身的性能并不是 Databricks 的重点。毕竟,商业正在使 DBRX 可用于 在 GitHub 上免费拥抱脸.

Databricks 希望客户使用该模型作为他们自己的法学硕士的基础。如果发生这种情况,它可能会改进客户聊天机器人或内部问答,同时还展示 DBRX 是如何使用 Databricks 的专有工具构建的。

Databricks 将开发 DBRX 的数据集放在一起,使用 Apache Spark 和 Databricks 笔记本进行数据处理,使用 Unity Catalog 进行数据管理和治理,并使用 MLflow 进行实验跟踪。

明尼克透露,企业对法学硕士的投资因对第三方所有权和治理的担忧而被推迟。 “必须将数据转移给第三方,没有模型权重的所有权,无法完全控制端到端的数据治理——这些都会减慢他们的速度,”他解释道。

“我们着手构建的是一个极其高效的……模型,企业可以使用该模型将其引入到自己的应用程序中,以满足自己的特定用例。”

Amalgam Insights 首席执行官兼首席分析师 Hyun Park 观察到 DBRX 的重要性在于,Databricks 可以展示模型是如何一步步构建的,作为其他企业可以遵循和微调的流程。

“在端到端模型调整、测试和操作化中,沿袭性、可见性、可重复性和模型所有权的结合非常重要。”

Park 指出,据他了解 Databricks 已经为客户构建了 50,000 多个定制模型。 “正是模型构建经验与大规模构建高性能模型的能力相结合,与最好的私有和开源工作相媲美,从企业 IT 的角度来看,这一公告对我来说非常引人注目。”

DBRX 消息是在 Databricks 不断变化的竞争背景下发布的。该公司与微软建立了长期战略合作伙伴关系,从而诞生了Azure Databricks——其中向用户承诺提供与微软这家微软巨头的云平台紧密相关的集成数据服务。

但自 2017 年推出该服务以来,微软已进入 Databricks 的 Lakehouse 市场——在该市场中,用户可以在一个环境中获得数据仓库和数据湖——并向用户承诺企业级法学硕士 10亿美元 OpenAI 合作伙伴关系。在其 Fabric 环境中, 微软还可以提供 从其事务数据库系统 Azure Cosmos DB 和 Azure SQL DB 进行“镜像”,无需移动数据即可访问分析服务。

Databricks 和 Microsoft 战略上悬而未决的一个问题是,LLM 技术的预期投资何时会到来。在一月, Gartner预测 企业在该技术上的支出今年不会出现,并且对其他 IT 投资影响不大。 ®

现货图片

最新情报

现货图片

在线答疑

你好呀! 我怎么帮你?