生成數據智能

Databricks 聲稱其開源 LLM 勝過 GPT-3.5

日期:

分析平台Databricks推出了開源基礎大型語言模型,希望企業選擇使用其工具來趕上LLM潮流。

該公司以 Apache Spark 為核心,發布了一系列基準測試,聲稱其通用 LLM(稱為 DBRX)在語言理解、程式設計和數學方面擊敗了開源競爭對手。該開發人員還聲稱,它在相同的指標上擊敗了 OpenAI 專有的 GPT-3.5。

DBRX由Mosaic AI開發, 收購 Databricks 花費 1.3 億美元,並在 Nvidia DGX Cloud 上進行訓練。 Databricks 聲稱它透過所謂的專家混合 (MoE) 架構優化了 DBRX 的效率,在該架構中,多個專家網路或學習者劃分一個問題。

Databricks 解釋說,該模型擁有 132 億個參數,但只有 36 億個參數在任一輸入上處於活動狀態。

Databricks 行銷副總裁 Joel Minnick 表示 註冊:「這是該模型能夠高效運作且運行速度極快的一個重要原因。實際上,如果您使用當今任何類型的主要聊天機器人,您可能習慣於等待並觀看答案的生成。有了 DBRX,這幾乎是瞬時的。”

但模型本身的效能並不是 Databricks 的重點。畢竟,商業正在使 DBRX 可用於 在 GitHub 上免費擁抱臉.

Databricks 希望客戶使用該模型作為他們自己的法學碩士的基礎。如果發生這種情況,它可能會改進客戶聊天機器人或內部問答,同時也展示 DBRX 是如何使用 Databricks 的專有工具建立的。

Databricks 將開發 DBRX 的資料集放在一起,使用 Apache Spark 和 Databricks 筆記本進行資料處理,使用 Unity Catalog 進行資料管理和治理,並使用 MLflow 進行實驗追蹤。

明尼克透露,企業對法學碩士的投資因對第三方所有權和治理的擔憂而被推遲。 「必須將資料轉移給第三方,沒有模型權重的所有權,無法完全控制端到端的資料治理——這些都會減慢他們的速度,」他解釋道。

“我們著手構建的是一個極其高效的……模型,企業可以使用該模型將其引入到自己的應用程式中,以滿足自己的特定用例。”

Amalgam Insights 執行長兼首席分析師 Hyun Park 觀察到 DBRX 的重要性在於,Databricks 可以逐步展示模型是如何建構的,作為其他企業可以遵循和微調的流程。

“在端到端模型調整、測試和操作化中,沿襲性、可見性、可重複性和模型所有權的結合非常重要。”

Park 指出,據他了解 Databricks 已經為客戶建立了 50,000 多個客製化模型。 「正是模型構建經驗和大規模構建高效能模型的能力(與最好的私有和開源工作相媲美)的結合,使得從企業IT 角度來看,這一公告對我來說非常引人注目。 」

DBRX 訊息是在 Databricks 不斷變化的競爭背景下發布的。該公司與微軟建立了長期戰略合作夥伴關係,從而誕生了Azure Databricks——其中向用戶承諾提供與微軟這家微軟巨頭的雲端平台緊密相關的整合數據服務。

但自 2017 年推出該服務以來,微軟已進入 Databricks 的 Lakehouse 市場——在該市場中,用戶可以在一個環境中獲得資料倉儲和資料湖——並向用戶承諾企業級法學碩士 10億美元 OpenAI 合作夥伴關係。在其 Fabric 環境中, 微軟還可以提供 從其事務資料庫系統 Azure Cosmos DB 和 Azure SQL DB 進行“鏡像”,無需移動資料即可存取分析服務。

Databricks 和 Microsoft 策略上懸而未決的一個問題是,LLM 技術的預期投資何時會到來。在一月, Gartner預測 企業在該技術上的支出今年不會出現,並且對其他 IT 投資影響不大。 ®

現貨圖片

最新情報

現貨圖片

和我們線上諮詢

你好呀!我怎麼幫你?