Generative Data Intelligence

Databricks heldur því fram að opinn uppspretta LLM yfirstígi GPT-3.5

Dagsetning:

Greiningarvettvangur Databricks hefur hleypt af stokkunum stóru tungumálamódeli með opnum uppspretta og vonast til að fyrirtæki muni velja að nota verkfæri þess til að hoppa á LLM-vagninn.

The biz, stofnað í kringum Apache Spark, birti fjölda viðmiða þar sem fullyrt var að almennur tilgangur LLM þess - kallaður DBRX - sigri opinn keppinauta um tungumálaskilning, forritun og stærðfræði. Framkvæmdaraðilinn hélt því einnig fram að hann hefði slegið út eigin GPT-3.5 frá OpenAI í sömu mæli.

DBRX var þróað af Mosaic AI, sem Databricks keypt fyrir 1.3 milljarða dala og þjálfaði á Nvidia DGX Cloud. Databricks heldur því fram að það hafi fínstillt DBRX fyrir skilvirkni með því sem það kallar blöndu af sérfræðingum (MoE) arkitektúr - þar sem mörg sérfræðinganet eða nemendur skipta upp vandamáli.

Databricks útskýrði að líkanið búi yfir 132 milljörðum breytum, en aðeins 36 milljarðar eru virkir á einu inntaki.

Joel Minnick, varaforseti Databricks markaðssetningar, sagði The Register: „Það er stór ástæða fyrir því að líkanið getur keyrt jafn skilvirkt og það gerir, en keyrir líka ofboðslega hratt. Í raun, ef þú notar einhvers konar helstu spjallbotna sem eru til í dag, þá ertu líklega vanur að bíða og horfa á svarið myndast. Með DBRX er það næstum samstundis.

En frammistaða líkansins sjálfs er ekki aðalatriðið fyrir Databricks. The biz er, þegar allt kemur til alls, að gera DBRX fáanlegur fyrir ókeypis á GitHub og Faðmandi andlit.

Databricks vonast til að viðskiptavinir noti líkanið sem grunn að eigin LLM. Ef það gerist gæti það bætt spjallbotna viðskiptavina eða innri spurningasvörun, en einnig sýnt hvernig DBRX var smíðað með því að nota sérverkfæri Databricks.

Databricks setti saman gagnasafnið sem DBRX var þróað úr með því að nota Apache Spark og Databricks fartölvur fyrir gagnavinnslu, Unity Catalog fyrir gagnastjórnun og stjórnun og MLflow til að rekja tilraunir.

Minnick leiddi í ljós að fjárfesting fyrirtækja í LLMs var seinkuð vegna ótta um eignarhald og stjórnarhætti þriðja aðila. „Að þurfa að flytja gögn út til þriðja aðila, hafa ekki eignarhald á líkanavigtum, geta ekki stjórnað fullkomlega stjórnun gagna frá enda til enda – þetta eru hlutir sem hægja á þeim,“ útskýrði hann.

„Það sem við ætluðum að byggja var ákaflega skilvirkt ... líkan sem fyrirtæki geta notað til að fara og koma með sín eigin forrit fyrir eigin sérstaka notkunartilvik.

Hyoun Park, forstjóri og yfirsérfræðingur hjá Amalgam Insights, tók eftir mikilvægi DBRX er að Databricks getur sýnt hvernig líkanið var smíðað, skref fyrir skref, sem ferli fyrir önnur fyrirtæki til að fylgja eftir og fínstilla.

„Sú samsetning af ætterni, sýnileika, endurtekningarnákvæmni og módeleignarhaldi í end-to-end módelstillingu, prófunum og rekstri er mikilvæg.

Park benti á að hann skildi að Databricks hefði þegar smíðað yfir 50,000 sérsniðnar gerðir fyrir viðskiptavini. „Það er þessi samsetning af reynslu af módelbyggingu og hæfileikanum til að gera það í stærðargráðu með afkastamiklu líkani á pari við bestu einka- og opinn uppspretta viðleitni sem gerir þessa tilkynningu athyglisverða fyrir mig frá upplýsingatækni fyrirtækjasjónarmiði.

DBRX fréttirnar spila á móti breyttu samkeppnisbakgrunni fyrir Databricks. The biz er í langtíma stefnumótandi samstarfi við Microsoft, sem leiddi til Azure Databricks - þar sem notendum er lofað samþættri gagnaþjónustu sem er nátengd skýjapalli Redmond risans.

En frá því að tilboðið var hleypt af stokkunum árið 2017 hefur Microsoft fært sig inn á vatnahúsamarkað Databricks – þar sem notendum býðst gagnavörugeymsla og gagnavötn í einu umhverfi – og lofar notendum LLM í fyrirtækisgráðu með þess 10 milljarðar dollara OpenAI samstarf. Í efni umhverfi sínu, Microsoft getur líka boðið „speglun“ frá viðskiptagagnagrunnskerfum sínum Azure Cosmos DB og Azure SQL DB, sem býður upp á aðgang að greiningarþjónustu án þess að flytja gögn.

Opin spurning sem hangir yfir stefnu bæði Databricks og Microsoft er hvenær væntanleg fjárfesting í LLM tækni er að fara að koma. Í janúar, Gartner spáði Útgjöld fyrirtækja til tækninnar munu ekki koma á þessu ári og mun hafa lítil áhrif á aðra upplýsingatæknifjárfestingu. ®

blettur_img

Nýjasta upplýsingaöflun

blettur_img

Spjallaðu við okkur

Sæll! Hvernig get ég aðstoðað þig?