Databricks twierdzi, że jego oprogramowanie typu open source LLM przechytrza GPT-3.5

Platforma analityczna Databricks uruchomiła podstawowy model dużego języka o otwartym kodzie źródłowym, mając nadzieję, że przedsiębiorstwa zdecydują się na korzystanie z jej narzędzi, aby wskoczyć na modę LLM.

Firma założona wokół Apache Spark opublikowała mnóstwo testów porównawczych, twierdząc, że jej uniwersalny LLM – nazwany DBRX – pokonuje rywali z otwartym kodem źródłowym w zakresie rozumienia języka, programowania i matematyki. Deweloper twierdził również, że w tych samych środkach pokonał zastrzeżony GPT-3.5 OpenAI.

DBRX został opracowany przez Mosaic AI, który Zdobyto kostki danych za 1.3 miliarda dolarów i trenował w chmurze Nvidia DGX. Firma Databricks twierdzi, że zoptymalizowała DBRX pod kątem wydajności dzięki tak zwanej architekturze mieszanki ekspertów (MoE), w której wiele sieci ekspertów lub uczniów dzieli problem.

Databricks wyjaśnił, że model posiada 132 miliardy parametrów, ale tylko 36 miliardów jest aktywnych na jednym wejściu.

– powiedział Joel Minnick, wiceprezes ds. marketingu Databricks Rejestr: „To główny powód, dla którego ten model może działać równie wydajnie, jak dotychczas, ale jednocześnie działa niesamowicie szybko. W praktyce, jeśli korzystasz z dowolnego rodzaju popularnych chatbotów, które są obecnie dostępne, prawdopodobnie jesteś przyzwyczajony do czekania i obserwowania, jak generowana jest odpowiedź. Dzięki DBRX jest to niemal natychmiastowe.”

Ale wydajność samego modelu nie jest celem Databricks. W końcu zadaniem jest udostępnienie DBRX za darmo na GitHubie i Przytulanie Twarzy.

Databricks ma nadzieję, że klienci wykorzystają ten model jako podstawę własnych LLM. Jeśli tak się stanie, może to ulepszyć chatboty klientów lub odpowiadanie na pytania wewnętrzne, jednocześnie pokazując, w jaki sposób DBRX został zbudowany przy użyciu zastrzeżonych narzędzi Databricks.

W firmie Databricks zebrano zbiór danych, na podstawie którego opracowano DBRX, korzystając z notatników Apache Spark i Databricks do przetwarzania danych, Unity Catalog do zarządzania danymi i zarządzania nimi oraz MLflow do śledzenia eksperymentów.

Minnick ujawnił, że inwestycje przedsiębiorstw w LLM zostały opóźnione ze względu na obawy dotyczące własności i zarządzania przez osoby trzecie. „Konieczność przekazywania danych stronom trzecim, brak własności wag modeli i brak możliwości pełnej kontroli nad całościowym zarządzaniem danymi – to wszystko spowalnia te procesy” – wyjaśnił.

„Postanowiliśmy zbudować niezwykle wydajny… model, z którego przedsiębiorstwa mogą korzystać, aby korzystać z własnych aplikacji w konkretnych przypadkach użycia”.

Hyoun Park, dyrektor generalny i główny analityk w Amalgam Insights, zauważył, że znaczenie DBRX polega na tym, że Databricks może pokazać, jak model został zbudowany, krok po kroku, jako proces, który inne przedsiębiorstwa mogą śledzić i dostrajać.

„To połączenie pochodzenia, widoczności, powtarzalności i własności modelu w kompleksowym dostrajaniu, testowaniu i operacjonalizacji modelu jest ważne”.

Park zauważył, że rozumie, że firma Databricks zbudowała już dla klientów ponad 50,000 XNUMX niestandardowych modeli. „To połączenie doświadczenia w budowaniu modeli i możliwości wykonywania tego na dużą skalę z modelem o wysokiej wydajności na poziomie najlepszych wysiłków prywatnych i open source sprawia, że to ogłoszenie jest dla mnie godne uwagi z punktu widzenia IT przedsiębiorstwa”.

Wiadomości DBRX dotyczą zmieniającego się otoczenia konkurencyjnego dla Databricks. Firma współpracuje długoterminowo, strategicznie z firmą Microsoft, co zaowocowało usługą Azure Databricks, w ramach której użytkownikom obiecuje się zintegrowane usługi danych ściśle powiązane z platformą chmurową giganta z Redmond.

Jednak od czasu wprowadzenia oferty w 2017 r. firma Microsoft wkroczyła na rynek Lakehouse firmy Databricks — gdzie użytkownikom oferuje się hurtownie danych i jeziora danych w jednym środowisku — i obiecuje użytkownikom LLM klasy korporacyjnej z to 10 miliardów dolarów Partnerstwo OpenAI. W środowisku Fabric, Microsoft może również zaoferować „mirroring” z transakcyjnych systemów baz danych Azure Cosmos DB i Azure SQL DB, oferując dostęp do usług analitycznych bez przenoszenia danych.

Otwartym pytaniem wiszącym nad strategiami zarówno Databricks, jak i Microsoftu jest to, kiedy nadejdzie powódź oczekiwanych inwestycji w technologie LLM. W styczniu, Gartner przewidział wydatki przedsiębiorstw na tę technologię nie zostaną poniesione w tym roku i będą miały niewielki wpływ na inne inwestycje w IT. ®

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/

Generatywna analiza danych

Databricks twierdzi, że jego open source LLM przechytrza GPT-3.5

Założyciel Skywise.ai, Chris McGinty, jest mówcą na konferencji IQT Quantum + AI w 2024 r. – Inside Quantum Technology

TRON wznawia trend wzrostowy, ale napotyka barierę na poziomie 0.12 USD

Najnowsza inteligencja

Informacje o wiadomościach Quantum: 27 kwietnia 2024 r.: Wiadomości od senatora stanu Kolorado, Johna Hickenloopera • Zagrożenia dla sieci Ethereum i cyberbezpieczeństwa kwantowego • Trendy na giełdzie – Inside Quantum…

Cardano stabilizuje się powyżej 0.46 USD, gdy byki zatrzymują tendencję spadkową

John Deaton składa oświadczenie Amicus na poparcie apelacji Coinbase przeciwko SEC

Drake’owi grozi pozew w związku z wokalem Tupaca AI

Shiba Inu liderem w wydajności kryptograficznej Robinhood

Najlepsze kasyna kryptowalutowe w 2024 r.: kompleksowy przewodnik

Czat z nami