Generatieve data-intelligentie

Databricks beweert dat zijn open source LLM GPT-3.5 te slim af is

Datum:

Analytics-platform Databricks heeft een open source fundamenteel groottaalmodel gelanceerd, in de hoop dat bedrijven ervoor zullen kiezen om hun tools te gebruiken om op de LLM-bandwagon te springen.

Het bedrijf, opgericht rond Apache Spark, publiceerde een hele reeks benchmarks waarin werd beweerd dat zijn algemene LLM โ€“ genaamd DBRX โ€“ open source-rivalen versloeg op het gebied van taalbegrip, programmeren en wiskunde. De ontwikkelaar beweerde ook dat het OpenAI's eigen GPT-3.5 op dezelfde maatstaven versloeg.

DBRX is ontwikkeld door Mozaรฏek AI, dat Databricks overgenomen voor $ 1.3 miljard, en getraind op Nvidia DGX Cloud. Databricks beweert dat het DBRX heeft geoptimaliseerd voor efficiรซntie met wat het een mix-of-experts (MoE)-architectuur noemt โ€“ waarbij meerdere expertnetwerken of leerlingen een probleem verdelen.

Databricks legde uit dat het model 132 miljard parameters bezit, maar dat er slechts 36 miljard actief zijn op รฉรฉn input.

Joel Minnick, marketing vice-president van Databricks, vertelde het Het register: โ€œDat is een belangrijke reden waarom het model net zo efficiรซnt kan werken, maar ook razendsnel werkt. In praktische termen: als je een van de grote chatbots gebruikt die er tegenwoordig zijn, ben je waarschijnlijk gewend om te wachten en te zien hoe het antwoord wordt gegenereerd. Met DBRX is het vrijwel onmiddellijk.โ€

Maar de prestaties van het model zelf zijn niet het punt voor Databricks. De biz maakt tenslotte DBRX beschikbaar voor gratis op GitHub en Gezicht knuffelen.

Databricks hoopt dat klanten het model gebruiken als basis voor hun eigen LLM's. Als dat gebeurt, kan dit de chatbots van klanten of het beantwoorden van interne vragen verbeteren, terwijl het ook laat zien hoe DBRX is gebouwd met behulp van de eigen tools van Databricks.

Databricks heeft de dataset samengesteld waaruit DBRX is ontwikkeld met behulp van Apache Spark- en Databricks-notebooks voor gegevensverwerking, Unity Catalog voor gegevensbeheer en -beheer, en MLflow voor het bijhouden van experimenten.

Minnick onthulde dat bedrijfsinvesteringen in LLM's werden vertraagd door angst voor eigendom en bestuur van derden. โ€œData moeten worden overgedragen aan derde partijen, geen eigenaar hoeven te zijn van de modelgewichten, niet in staat zijn om het beheer van de data end-to-end volledig te controleren โ€“ dit zijn dingen die hen vertragen,โ€ legde hij uit.

โ€œWat we wilden bouwen was een uiterst efficiรซnt โ€ฆ model dat bedrijven kunnen gebruiken om naar hun eigen applicaties te gaan voor hun eigen specifieke gebruiksscenarioโ€™s.โ€

Hyoun Park, CEO en hoofdanalist bij Amalgam Insights, merkte op dat het belang van DBRX is dat Databricks stap voor stap kan laten zien hoe het model is opgebouwd, als een proces dat andere ondernemingen kunnen volgen en verfijnen.

โ€œDie combinatie van afkomst, zichtbaarheid, herhaalbaarheid en modeleigendom bij het end-to-end afstemmen, testen en operationaliseren van modellen is belangrijk.โ€

Park merkte op dat hij begreep dat Databricks al meer dan 50,000 aangepaste modellen voor klanten had gebouwd. โ€œHet is die combinatie van ervaring met het bouwen van modellen en de mogelijkheid om dit op schaal te doen met een goed presterend model dat vergelijkbaar is met de beste private en open source-inspanningen die deze aankondiging voor mij opmerkelijk maakt vanuit een zakelijk IT-perspectief.โ€

Het DBRX-nieuws speelt zich af tegen een veranderende concurrentieachtergrond voor Databricks. Het bedrijf heeft een langdurig strategisch partnerschap met Microsoft, wat heeft geresulteerd in Azure Databricks โ€“ waarin gebruikers geรฏntegreerde datadiensten worden beloofd die nauw verbonden zijn met het cloudplatform van de Redmond-gigant.

Maar sinds het aanbod in 2017 werd gelanceerd, heeft Microsoft zijn intrede gedaan in de lakehouse-markt van Databricks โ€“ waar gebruikers datawarehousing en data lakes in รฉรฉn omgeving aangeboden krijgen โ€“ en belooft het gebruikers LLMโ€™s van ondernemingskwaliteit met zijn $10 miljard OpenAI-partnerschap. In zijn Fabric-omgeving, Microsoft kan het ook aanbieden โ€˜mirroringโ€™ vanuit de transactionele databasesystemen Azure Cosmos DB en Azure SQL DB, waardoor toegang tot analyseservices wordt geboden zonder gegevens te verplaatsen.

Een open vraag die boven de strategieรซn van zowel Databricks als Microsoft hangt, is wanneer de vloed aan verwachte investeringen in LLM-technologieรซn zal arriveren. In januari, Gartner voorspelde De bedrijfsuitgaven voor de technologie zullen dit jaar niet plaatsvinden en zullen weinig impact hebben op andere IT-investeringen. ยฎ

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?