Generative Data Intelligence

Databricks стверджує, що її LLM з відкритим кодом перевершує GPT-3.5

Дата:

Платформа аналітики Databricks запустила основну модель великої мови з відкритим вихідним кодом, сподіваючись, що підприємства вирішать використовувати її інструменти, щоб підхопити перемогу в LLM.

Підприємство, засноване навколо Apache Spark, опублікувало низку тестів, в яких стверджувалося, що його LLM загального призначення – під назвою DBRX – переміг конкурентів з відкритим кодом у розумінні мови, програмуванні та математиці. Розробник також стверджував, що він переміг власний OpenAI GPT-3.5 за тими ж показниками.

DBRX був розроблений Mosaic AI, який Databricks придбано за 1.3 мільярда доларів США та навчався на Nvidia DGX Cloud. Databricks стверджує, що оптимізувала DBRX для підвищення ефективності за допомогою так званої архітектури змішаних експертів (MoE), де кілька експертних мереж або учнів ділять проблему.

Databricks пояснив, що модель має 132 мільярди параметрів, але лише 36 мільярдів активні на кожному вході.

Про це заявив віце-президент Databricks з маркетингу Джоел Міннік Реєстр: «Це вагома причина, чому модель може працювати так само ефективно, як і вона, але при цьому працює неймовірно швидко. З практичної точки зору, якщо ви користуєтеся будь-якими основними чат-ботами, які існують сьогодні, ви, ймовірно, звикли чекати та спостерігати, як генерується відповідь. З DBRX це майже миттєво».

Але для Databricks головне не продуктивність самої моделі. Зрештою, бізнес полягає в тому, щоб зробити DBRX доступним для безкоштовно на GitHub та Обіймати обличчя.

Databricks сподівається, що клієнти використовуватимуть модель як основу для своїх власних LLM. Якщо це станеться, це може покращити роботу чат-ботів клієнтів або відповіді на внутрішні питання, а також показати, як DBRX було створено з використанням фірмових інструментів Databricks.

Databricks об’єднав набір даних, на основі якого було розроблено DBRX, використовуючи ноутбуки Apache Spark і Databricks для обробки даних, каталог Unity для керування даними та керування ними та MLflow для відстеження експериментів.

Міннік розповів, що інвестиції підприємств у LLM були відкладені через побоювання щодо володіння та управління третіми особами. «Необхідність передавати дані третім сторонам, відсутність права власності на вагові коефіцієнти моделі, нездатність повністю контролювати управління даними від кінця до кінця – це речі, які сповільнюють їх», – пояснив він.

«Те, що ми збиралися побудувати, було надзвичайно ефективною… моделлю, яку підприємства можуть використовувати, щоб перейти та застосувати власні програми для власних конкретних випадків використання».

Хьон Пак, генеральний директор і головний аналітик Amalgam Insights, зауважив, що значення DBRX полягає в тому, що Databricks може показати, як покроково будувалася модель як процес, який інші підприємства можуть слідувати та налаштовувати.

«Таке поєднання походження, видимості, повторюваності та володіння моделлю в наскрізному налаштуванні моделі, тестуванні та введенні в дію є важливим».

Парк зазначив, що, як йому відомо, компанія Databricks вже створила понад 50,000 XNUMX індивідуальних моделей для клієнтів. «Це поєднання досвіду створення моделей і здатності робити це в масштабі з високопродуктивною моделлю нарівні з найкращими зусиллями приватного та відкритого коду робить це оголошення помітним для мене з точки зору корпоративних ІТ».

Новини DBRX розгортаються на мінливому конкурентному тлі для Databricks. Підприємство має довгострокове стратегічне партнерство з Microsoft, результатом якого є Azure Databricks, де користувачам обіцяють інтегровані служби даних, тісно пов’язані з хмарною платформою гіганта з Редмонда.

Але після того, як ця пропозиція була запущена в 2017 році, Microsoft перейшла на ринок Lakehouse Databricks, де користувачам пропонуються сховища даних і озера даних в одному середовищі, і обіцяє користувачам LLM корпоративного рівня з це 10 мільярдів доларів Партнерство OpenAI. У своєму середовищі Fabric, Microsoft також може запропонувати «дзеркалювання» зі своїх систем транзакційних баз даних Azure Cosmos DB і Azure SQL DB, пропонуючи доступ до аналітичних служб без переміщення даних.

Над стратегіями Databricks і Microsoft залишається відкритим питання про те, коли прибуде потік очікуваних інвестицій у технології LLM. В січні, Гартнер передбачив Витрати підприємств на цю технологію не будуть цього року, і це мало вплине на інші інвестиції в ІТ. ®

spot_img

Остання розвідка

spot_img

Зв'яжіться з нами!

Привіт! Чим я можу вам допомогти?