Generativ dataintelligens

Databricks hevder sin åpen kildekode LLM overliste GPT-3.5

Dato:

Analyseplattformen Databricks har lansert en åpen kildekode grunnleggende stor språkmodell, i håp om at bedrifter vil velge å bruke verktøyene deres til å hoppe på LLM-vognen.

Biz, grunnlagt rundt Apache Spark, publiserte en rekke benchmarks som hevdet at dens generelle LLM – kalt DBRX – slo åpen kildekode-rivaler på språkforståelse, programmering og matematikk. Utvikleren hevdet også at den slo OpenAIs proprietære GPT-3.5 på tvers av de samme målene.

DBRX ble utviklet av Mosaic AI, som Databricks kjøpt opp for 1.3 milliarder dollar, og trent på Nvidia DGX Cloud. Databricks hevder at den optimaliserte DBRX for effektivitet med det den kaller en blanding av eksperter (MoE) arkitektur – der flere ekspertnettverk eller elever deler opp et problem.

Databricks forklarte at modellen har 132 milliarder parametere, men bare 36 milliarder er aktive på en hvilken som helst inngang.

Joel Minnick, Databricks markedsdirektør, fortalte Registeret: «Det er en stor grunn til at modellen er i stand til å kjøre så effektivt som den gjør, men også kjører lynraskt. Rent praktisk, hvis du bruker noen form for store chatbots som er der ute i dag, er du sannsynligvis vant til å vente og se på at svaret blir generert. Med DBRX er det nesten øyeblikkelig."

Men ytelsen til selve modellen er ikke poenget for Databricks. Biz er tross alt å gjøre DBRX tilgjengelig for gratis på GitHub og Klemme ansiktet.

Databricks håper kundene bruker modellen som grunnlag for sine egne LLM-er. Hvis det skjer, kan det forbedre kundechatboter eller intern spørsmålssvar, samtidig som det viser hvordan DBRX ble bygget ved hjelp av Databricks sine proprietære verktøy.

Databricks satte sammen datasettet som DBRX ble utviklet fra ved å bruke Apache Spark og Databricks notatbøker for databehandling, Unity Catalog for dataadministrasjon og styring, og MLflow for eksperimentsporing.

Minnick avslørte at bedriftsinvesteringer i LLM-er ble forsinket av frykt for tredjeparts eierskap og styring. "Å måtte flytte data ut til tredjeparter, ikke ha eierskap over modellvektene, ikke kunne kontrollere styringen av dataene ende-til-ende - dette er ting som bremser dem," forklarte han.

"Det vi satte oss for å bygge var en ekstremt effektiv ... modell som bedrifter kan bruke til å gå og bringe til sine egne applikasjoner for sine egne spesifikke brukstilfeller."

Hyoun Park, administrerende direktør og sjefanalytiker i Amalgam Insights, observerte at betydningen av DBRX er at Databricks kan vise hvordan modellen ble bygget, steg-for-steg, som en prosess for andre bedrifter å følge og finjustere.

"Denne kombinasjonen av avstamning, synlighet, repeterbarhet og modelleierskap i ende-til-ende modelljustering, testing og operasjonalisering er viktig."

Park bemerket at han forsto Databricks hadde bygget over 50,000 XNUMX tilpassede modeller for kunder allerede. "Det er den kombinasjonen av erfaring med modellbygging og evnen til å gjøre det i stor skala med en høyytende modell på nivå med den beste private og åpen kildekode-innsatsen som gjør denne kunngjøringen bemerkelsesverdig for meg fra et IT-bedriftsperspektiv."

DBRX-nyhetene utspiller seg mot et skiftende konkurransebakgrunn for Databricks. Biz har et langsiktig strategisk partnerskap med Microsoft, som resulterte i Azure Databricks – der brukere loves integrerte datatjenester nært knyttet til Redmond-gigantens skyplattform.

Men siden tilbudet ble lansert i 2017, har Microsoft flyttet inn i Databricks lakehouse-marked – der brukere tilbys datavarehus og datainnsjøer i ett miljø – og lover brukere LLM-er i bedriftsklasse med sine 10 milliarder dollar OpenAI-partnerskap. I sitt tekstilmiljø, Microsoft kan også tilby "speiling" fra transaksjonsdatabasesystemene Azure Cosmos DB og Azure SQL DB, og tilbyr tilgang til analysetjenester uten å flytte data.

Et åpent spørsmål som henger over strategiene til både Databricks og Microsoft er når flommen av forventede investeringer i LLM-teknologier kommer. I januar, Gartner spådde bedriftsutgifter til teknologien kommer ikke i år, og vil ha liten innvirkning på andre IT-investeringer. ®

spot_img

Siste etterretning

spot_img

Chat med oss

Hei der! Hvordan kan jeg hjelpe deg?