This Ultra Light AI Model Fits On Your Phone And Can Beat ChatGPT - Decrypt

Microsoft tänään väitti että se on julkaissut "kykevimmät ja kustannustehokkaimmat saatavilla olevat pienkielimallit (SLM)", sanotaan Phi-3- sen kolmas iteraatio Phi pienten kielimallien perhe (SLM:t) – suorituskykyä parempi kuin verrattain kokoiset mallit ja muutama suurempi.

Small Language Model (SLM) on eräänlainen tekoälymalli, joka on suunniteltu erittäin tehokkaaksi suorittamaan tiettyjä kieleen liittyviä tehtäviä. Toisin kuin Large Language Models (LLM) -mallit, jotka sopivat hyvin monenlaisiin yleisiin tehtäviin, SLM:t on rakennettu pienemmälle tietojoukolle, jotta ne olisivat tehokkaampia ja kustannustehokkaampia tietyissä käyttötapauksissa.

Microsoft selitti, että Phi-3:sta on eri versioita, joista pienin on Phi-3 Mini, 3.8 miljardin parametrin malli, joka on koulutettu 3.3 biljoonalla tokenilla. Suhteellisen pienestä koostaan huolimatta Llama-3:n korpus painaa yli 15 biljoonaa datatunnisteet – Phi-3 Mini pystyy edelleen käsittelemään 128 4 kontekstitunnistetta. Tämä tekee siitä verrattavissa GPT-3:ään ja päihittää Llama-XNUMX:n ja Mistral Largen merkkikapasiteetin suhteen.

Toisin sanoen Meta.ai:n ja Mistral Largen Llama-3:n kaltaiset tekoälyt voivat romahtaa pitkän keskustelun jälkeen tai pyytää paljon ennen kuin tämä kevyt malli alkaa kamppailla.

Yksi Phi-3 Minin merkittävimmistä eduista on sen kyky sovittaa ja toimia tyypillisessä älypuhelimessa. Microsoft testasi mallia iPhone 14:ssä, ja se toimi ilman ongelmia, tuottaen 14 merkkiä sekunnissa. Phi-3 Mini vaatii vain 1.8 Gt VRAM-muistia, joten se on kevyt ja tehokas vaihtoehto käyttäjille, joilla on tarkempia vaatimuksia.

Vaikka Phi-3 Mini ei ehkä ole yhtä sopiva huippuluokan koodaajille tai ihmisille, joilla on laajat vaatimukset, se voi olla tehokas vaihtoehto käyttäjille, joilla on erityistarpeita. Esimerkiksi startup-yritykset, jotka tarvitsevat chatbotin, tai ihmiset, jotka hyödyntävät LLM:itä data-analyysiin, voivat käyttää Phi-3 Miniä tehtäviin, kuten tietojen järjestämiseen, tiedon poimimiseen, matemaattisten päättelyjen tekemiseen ja agenttien rakentamiseen. Jos mallille annetaan Internet-yhteys, siitä voi tulla melko tehokas, mikä kompensoi sen kyvyttömyyden reaaliaikaisilla tiedoilla.

Phi-3 Mini saavuttaa korkeat testitulokset, koska Microsoft keskittyy kuratoimaan tietojoukonsa mahdollisimman hyödyllisillä tiedoilla. Laajempi Phi-perhe ei itse asiassa ole hyvä asiatietoa vaativiin tehtäviin, mutta korkea päättelykyky asettaa heidät suurten kilpailijoiden edelle. Phi-3 Medium (14 miljardin parametrin malli) päihittää jatkuvasti tehokkaat LLM:t, kuten GPT-3.5 – ChatGPT:n ilmaista versiota käyttävä LLM – ja Mini-versio päihittää tehokkaat mallit, kuten Mixtral-8x7B, useimmissa synteettisissä vertailuissa.

On kuitenkin syytä huomata, että Phi-3 ei ole avoimen lähdekoodin, kuten edeltäjänsä Phi-2. Sen sijaan se on an avoin malli, mikä tarkoittaa, että se on saatavilla ja käytettävissä, mutta sillä ei ole samaa avoimen lähdekoodin lisensointia kuin Phi-2:lla, mikä mahdollistaa laajemman käytön ja kaupalliset sovellukset.

Tulevina viikkoina Microsoft ilmoitti julkaisevansa lisää Phi-3-perheen malleja, mukaan lukien Phi-3 Small (7 miljardia parametria) ja edellä mainittu Phi-3 Medium.

Microsoft on asettanut Phi-3 Minin saataville Azure AI Studiossa, Hugging Facessa ja Ollamassa. Malli on ohjeiden mukaan viritetty ja optimoitu ONNX Runtimelle Windows DirectML:n tuella sekä eri alustojen välisellä tuella eri grafiikkasuorittimilla, prosessoreilla ja jopa mobiililaitteilla.

Pysy ajan tasalla kryptouutisista, saat päivittäiset päivitykset postilaatikkoosi.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://decrypt.co/227974/microsoft-phi-3-mini-small-ai-language-model

Generatiivinen tiedustelu

Tämä ultrakevyt tekoälymalli sopii puhelimeesi ja voi voittaa ChatGPT:n – purkaa salauksen

Pysy ajan tasalla kryptouutisista, saat päivittäiset päivitykset postilaatikkoosi.

Upeita Star Wars -kokemuksia VR:ssä juuri nyt

Star Wars VR Games Katso syvät alennukset 4. toukokuuta

Uusin älykkyys

Tämän viikon mahtavat tekniset tarinat verkosta (4. toukokuuta asti)

PEPE pohjustettu suureen harppaukseen: 80 % hinnankorotus tulossa?

Bitcoin ylittää 64,000 78 dollaria sen jälkeen, kun Grayscalen GBTC katkaisee 63 päivän ulosvirtausputken ja XNUMX miljoonaa dollaria uutta rahaa

Moonbirdsin tekijänoikeuskiista paljastaa puutteet krypton IP-pakkomielle - Pura salaus

WienerAI saavuttaa merkittävän virstanpylvään, kun omistajat ryntäsivät panoksensa WAI:han

Toukokuu 2024: Bitgert Coinin pysäyttämätön kryptovauhti | Live Bitcoin-uutiset

Keskustele kanssamme