Generatiivne andmeluure

Databricks väidab, et tema avatud lähtekoodiga LLM kavaldab GPT-3.5

kuupäev:

Analüütikaplatvorm Databricks on käivitanud avatud lähtekoodiga põhilise suure keelemudeli, lootes, et ettevõtted otsustavad kasutada selle tööriistu, et hüpata LLM-i vagunisse.

Apache Sparki ümber asutatud äriettevõte avaldas hulga võrdlusnäitajaid, väites, et selle üldotstarbeline LLM (nimega DBRX) ületab avatud lähtekoodiga rivaale keele mõistmise, programmeerimise ja matemaatika osas. Arendaja väitis ka, et ületas samade meetmetega OpenAI patenteeritud GPT-3.5.

DBRX-i töötas välja Mosaic AI, mis Andmeplokid omandatud 1.3 miljardi dollari eest ja koolitatud Nvidia DGX Cloudis. Databricks väidab, et optimeeris DBRX-i tõhususe tagamiseks nn ekspertide seguarhitektuuriga (MoE), kus mitu ekspertide võrgustikku või õppijat jagavad probleemi.

Databricks selgitas, et mudelil on 132 miljardit parameetrit, kuid ainult 36 miljardit on ühel sisendil aktiivsed.

Joel Minnick, Databricksi turunduse asepresident, rääkis Register: "See on suur põhjus, miks mudel suudab töötada sama tõhusalt kui ta töötab, kuid töötab ka hämmastavalt kiiresti. Praktilises plaanis, kui kasutate mis tahes suuremaid vestlusroboteid, mis praegu saadaval on, olete tõenäoliselt harjunud ootama ja jälgima, kuidas vastus genereeritakse. DBRX-iga on see peaaegu hetkeline.

Kuid mudeli enda jõudlus pole Databricksi jaoks oluline. Lõppude lõpuks teeb biz DBRX-i jaoks kättesaadavaks GitHubis tasuta ja Kallistav nägu.

Databricks loodab, et kliendid kasutavad seda mudelit oma LLM-ide alusena. Kui see juhtub, võib see parandada klientide vestlusroboteid või siseküsimustele vastamist, näidates samas ka seda, kuidas DBRX ehitati Databricksi patenteeritud tööriistade abil.

Databricks pani kokku andmekogumi, millest DBRX arendati, kasutades andmetöötluseks Apache Sparki ja Databricksi märkmikke, andmehalduseks ja haldamiseks Unity Catalogi ning katsete jälgimiseks MLflow'i.

Minnick paljastas, et ettevõtete investeeringuid elukestva elujõuga ettevõtetesse lükkasid edasi hirmud kolmandate osapoolte omandi ja juhtimise pärast. "Andmete teisaldamine kolmandatele osapooltele, mudelikaalude omandiõiguse puudumine, andmete täieliku haldamise täielik kontroll – need on asjad, mis aeglustavad seda," selgitas ta.

"See, mida me kavatsesime luua, oli äärmiselt tõhus … mudel, mida ettevõtted saavad kasutada oma rakenduste jaoks oma konkreetsete kasutusjuhtude jaoks."

Amalgam Insightsi tegevjuht ja peaanalüütik Hyoun Park märkis, et DBRX-i olulisus seisneb selles, et Databricks suudab samm-sammult näidata, kuidas mudel ehitati, et teised ettevõtted saaksid seda jälgida ja täpsustada.

"See põlvnemise, nähtavuse, korratavuse ja mudeli omandiõiguse kombinatsioon mudelite täielikul häälestamisel, testimisel ja kasutuselevõtul on oluline."

Park märkis, et ta mõistab, et Databricks on klientidele juba ehitanud üle 50,000 XNUMX kohandatud mudeli. "See kombinatsioon mudelite loomise kogemusest ja võimalusest teha seda mastaapselt suure jõudlusega mudeliga, mis on võrdselt parimate privaat- ja avatud lähtekoodiga jõupingutustega, teeb selle teadaande ettevõtte IT vaatenurgast minu jaoks tähelepanuväärseks."

DBRX-i uudised esitatakse Databricksi muutuva konkurentsi taustal. Ettevõttel on pikaajaline strateegiline partnerlus Microsoftiga, mille tulemuseks on Azure Databricks, kus kasutajatele lubatakse integreeritud andmeteenuseid, mis on tihedalt seotud Redmondi hiiglase pilveplatvormiga.

Kuid alates pakkumise käivitamisest 2017. aastal on Microsoft liikunud Databricksi järvehoonete turule – kus kasutajatele pakutakse ühes keskkonnas andmehoidlat ja andmejärve – ning lubab kasutajatele ettevõttetasemel LLM-e. oma 10 miljardit dollarit OpenAI partnerlus. Oma kangakeskkonnas Microsoft võib ka pakkuda "peegeldab" oma tehingute andmebaasisüsteemidest Azure Cosmos DB ja Azure SQL DB, pakkudes juurdepääsu analüütikateenustele ilma andmeid teisaldamata.

Lahtine küsimus, mis nii Databricksi kui ka Microsofti strateegiate kohal rippub, on see, millal saabub LLM-tehnoloogiatesse eeldatavate investeeringute tulv. jaanuaril, Gartner ennustas Ettevõtete kulutusi tehnoloogiale sel aastal ei tehta ja see ei mõjuta teisi IT-investeeringuid. ®

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?