Generatywna analiza danych

Databricks twierdzi, że jego open source LLM przechytrza GPT-3.5

Data:

Platforma analityczna Databricks uruchomiła podstawowy model dużego języka o otwartym kodzie źródłowym, mając nadzieję, że przedsiębiorstwa zdecydują się na korzystanie z jej narzędzi, aby wskoczyć na modę LLM.

Firma założona wokół Apache Spark opublikowała mnóstwo testów porównawczych, twierdząc, że jej uniwersalny LLM – nazwany DBRX – pokonuje rywali z otwartym kodem źródłowym w zakresie rozumienia języka, programowania i matematyki. Deweloper twierdził również, że w tych samych środkach pokonał zastrzeżony GPT-3.5 OpenAI.

DBRX został opracowany przez Mosaic AI, który Zdobyto kostki danych za 1.3 miliarda dolarów i trenował w chmurze Nvidia DGX. Firma Databricks twierdzi, że zoptymalizowała DBRX pod kątem wydajności dzięki tak zwanej architekturze mieszanki ekspertów (MoE), w której wiele sieci ekspertów lub uczniów dzieli problem.

Databricks wyjaśnił, że model posiada 132 miliardy parametrów, ale tylko 36 miliardów jest aktywnych na jednym wejściu.

– powiedział Joel Minnick, wiceprezes ds. marketingu Databricks Rejestr: „To główny powód, dla którego ten model może działać równie wydajnie, jak dotychczas, ale jednocześnie działa niesamowicie szybko. W praktyce, jeśli korzystasz z dowolnego rodzaju popularnych chatbotów, które są obecnie dostępne, prawdopodobnie jesteś przyzwyczajony do czekania i obserwowania, jak generowana jest odpowiedź. Dzięki DBRX jest to niemal natychmiastowe.”

Ale wydajność samego modelu nie jest celem Databricks. W końcu zadaniem jest udostępnienie DBRX za darmo na GitHubie i Przytulanie Twarzy.

Databricks ma nadzieję, że klienci wykorzystają ten model jako podstawę własnych LLM. Jeśli tak się stanie, może to ulepszyć chatboty klientów lub odpowiadanie na pytania wewnętrzne, jednocześnie pokazując, w jaki sposób DBRX został zbudowany przy użyciu zastrzeżonych narzędzi Databricks.

W firmie Databricks zebrano zbiór danych, na podstawie którego opracowano DBRX, korzystając z notatników Apache Spark i Databricks do przetwarzania danych, Unity Catalog do zarządzania danymi i zarządzania nimi oraz MLflow do śledzenia eksperymentów.

Minnick ujawnił, że inwestycje przedsiębiorstw w LLM zostały opóźnione ze względu na obawy dotyczące własności i zarządzania przez osoby trzecie. „Konieczność przekazywania danych stronom trzecim, brak własności wag modeli i brak możliwości pełnej kontroli nad całościowym zarządzaniem danymi – to wszystko spowalnia te procesy” – wyjaśnił.

„Postanowiliśmy zbudować niezwykle wydajny… model, z którego przedsiębiorstwa mogą korzystać, aby korzystać z własnych aplikacji w konkretnych przypadkach użycia”.

Hyoun Park, dyrektor generalny i główny analityk w Amalgam Insights, zauważył, że znaczenie DBRX polega na tym, że Databricks może pokazać, jak model został zbudowany, krok po kroku, jako proces, który inne przedsiębiorstwa mogą śledzić i dostrajać.

„To połączenie pochodzenia, widoczności, powtarzalności i własności modelu w kompleksowym dostrajaniu, testowaniu i operacjonalizacji modelu jest ważne”.

Park zauważył, że rozumie, że firma Databricks zbudowała już dla klientów ponad 50,000 XNUMX niestandardowych modeli. „To połączenie doświadczenia w budowaniu modeli i możliwości wykonywania tego na dużą skalę z modelem o wysokiej wydajności na poziomie najlepszych wysiłków prywatnych i open source sprawia, że ​​to ogłoszenie jest dla mnie godne uwagi z punktu widzenia IT przedsiębiorstwa”.

Wiadomości DBRX dotyczą zmieniającego się otoczenia konkurencyjnego dla Databricks. Firma współpracuje długoterminowo, strategicznie z firmą Microsoft, co zaowocowało usługą Azure Databricks, w ramach której użytkownikom obiecuje się zintegrowane usługi danych ściśle powiązane z platformą chmurową giganta z Redmond.

Jednak od czasu wprowadzenia oferty w 2017 r. firma Microsoft wkroczyła na rynek Lakehouse firmy Databricks — gdzie użytkownikom oferuje się hurtownie danych i jeziora danych w jednym środowisku — i obiecuje użytkownikom LLM klasy korporacyjnej z to 10 miliardów dolarów Partnerstwo OpenAI. W środowisku Fabric, Microsoft może również zaoferować „mirroring” z transakcyjnych systemów baz danych Azure Cosmos DB i Azure SQL DB, oferując dostęp do usług analitycznych bez przenoszenia danych.

Otwartym pytaniem wiszącym nad strategiami zarówno Databricks, jak i Microsoftu jest to, kiedy nadejdzie powódź oczekiwanych inwestycji w technologie LLM. W styczniu, Gartner przewidział wydatki przedsiębiorstw na tę technologię nie zostaną poniesione w tym roku i będą miały niewielki wpływ na inne inwestycje w IT. ®

spot_img

Najnowsza inteligencja

spot_img

Czat z nami

Cześć! Jak mogę ci pomóc?