Generatiivne andmeluure

See ülikerge tehisintellekti mudel sobib teie telefoni ja võidab ChatGPT-d – dekrüpteerida

kuupäev:

Microsoft täna väitis et ta on välja andnud "kõige võimekamad ja kulutõhusamad väikekeelemudelid (SLM-id), mis on saadaval", öeldakse Phi-3— selle kolmas iteratsioon Väikeste keelemudelite perekond Phi (SLM-id) – ületab võrreldava suurusega mudeleid ja mõnda suuremat mudelit.

Väike keelemudel (SLM) on AI mudeli tüüp, mis on loodud olema äärmiselt tõhus konkreetsete keelega seotud ülesannete täitmisel. Erinevalt suurtest keelemudelitest (LLM), mis sobivad hästi paljude üldiste ülesannete jaoks, on SLM-id üles ehitatud väiksemale andmekogumile, et muuta need konkreetsetel kasutusjuhtudel tõhusamaks ja kulutõhusamaks.

Microsoft selgitas, et Phi-3 on saadaval erinevates versioonides, millest väikseim on Phi-3 Mini, 3.8 miljardi parameetriga mudel, mis on treenitud 3.3 triljoni žetooniga. Vaatamata oma suhteliselt väikesele suurusele kaalub Llama-3 korpus rohkem 15 triljonit andmemärgid – Phi-3 Mini on endiselt võimeline käsitlema 128 4 kontekstimärki. See teeb selle võrreldavaks GPT-3-ga ning ületab märgimahu poolest Llama-XNUMX ja Mistral Large'i.

Teisisõnu võivad Meta.ai ja Mistral Large'i Llama-3-laadsed tehisintellektid pärast pikka vestlust kokku kukkuda või anda märku enne, kui see kerge mudel hakkab vaeva nägema.

Phi-3 Mini üks olulisemaid eeliseid on selle võime mahutada ja töötada tavalise nutitelefoniga. Microsoft testis mudelit iPhone 14-ga ja see töötas probleemideta, genereerides 14 märki sekundis. Phi-3 Mini töötamiseks on vaja ainult 1.8 GB VRAM-i, mistõttu on see kerge ja tõhus alternatiiv rohkem keskendunud nõudmistele.

Kuigi Phi-3 Mini ei pruugi olla nii sobiv tipptasemel kodeerijatele või laiade nõudmistega inimestele, võib see olla tõhus alternatiiv spetsiifiliste vajadustega kasutajatele. Näiteks saavad idufirmad, kes vajavad vestlusrobotit, või inimesed, kes kasutavad andmete analüüsiks LLM-e, kasutada Phi-3 Minit selliste ülesannete jaoks nagu andmete korraldamine, teabe hankimine, matemaatika arutluskäik ja agentide loomine. Kui mudelile antakse juurdepääs Internetile, võib see muutuda üsna võimsaks, kompenseerides selle võimaluste puudumise reaalajas teabega.

Phi-3 Mini saavutab kõrged testitulemused, kuna Microsoft keskendub oma andmestiku kureerimisele võimalikult kasuliku teabega. Laiem Phi perekond ei sobi tegelikult faktiteadmisi nõudvate ülesannete jaoks, kuid kõrge arutlusoskus asetab nad suurematest konkurentidest kõrgemale. Phi-3 Medium (14 miljardi parameetriga mudel) ületab järjekindlalt võimsaid LLM-e nagu GPT-3.5 – ChatGPT tasuta versiooni toiteallika LLM – ja Mini-versioon edestab enamikus sünteetilistes võrdlusnäitajates võimsaid mudeleid nagu Mixtral-8x7B.

Väärib märkimist, et Phi-3 ei ole avatud lähtekoodiga nagu tema eelkäija Phi-2. Selle asemel on see an avatud mudel, mis tähendab, et see on juurdepääsetav ja kasutamiseks saadaval, kuid sellel ei ole sama avatud lähtekoodiga litsentsi kui Phi-2-l, mis võimaldab laiemat kasutamist ja kommertsrakendusi.

Lähinädalatel teatas Microsoft, et annab välja rohkem Phi-3 perekonna mudeleid, sealhulgas Phi-3 Small (7 miljardit parameetrit) ja ülalmainitud Phi-3 Medium.

Microsoft on teinud Phi-3 Mini kättesaadavaks Azure AI Studio, Hugging Face ja Ollama jaoks. Mudel on juhiste järgi häälestatud ja optimeeritud ONNX Runtime jaoks koos Windows DirectML-i toega, samuti platvormideülese toega erinevatel GPU, CPU ja isegi mobiilse riistvara vahel.

Olge kursis krüptouudistega, saate oma postkasti igapäevaseid värskendusi.

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?