Generatiivinen tiedustelu

Tämä ultrakevyt tekoälymalli sopii puhelimeesi ja voi voittaa ChatGPT:n – purkaa salauksen

Treffi:

Microsoft tänään väitti että se on julkaissut "kykevimmät ja kustannustehokkaimmat saatavilla olevat pienkielimallit (SLM)", sanotaan Phi-3- sen kolmas iteraatio Phi pienten kielimallien perhe (SLM:t) – suorituskykyä parempi kuin verrattain kokoiset mallit ja muutama suurempi.

Small Language Model (SLM) on eräänlainen tekoälymalli, joka on suunniteltu erittäin tehokkaaksi suorittamaan tiettyjä kieleen liittyviä tehtäviä. Toisin kuin Large Language Models (LLM) -mallit, jotka sopivat hyvin monenlaisiin yleisiin tehtäviin, SLM:t on rakennettu pienemmälle tietojoukolle, jotta ne olisivat tehokkaampia ja kustannustehokkaampia tietyissä käyttötapauksissa.

Microsoft selitti, että Phi-3:sta on eri versioita, joista pienin on Phi-3 Mini, 3.8 miljardin parametrin malli, joka on koulutettu 3.3 biljoonalla tokenilla. Suhteellisen pienestä koostaan ​​huolimatta Llama-3:n korpus painaa yli 15 biljoonaa datatunnisteet – Phi-3 Mini pystyy edelleen käsittelemään 128 4 kontekstitunnistetta. Tämä tekee siitä verrattavissa GPT-3:ään ja päihittää Llama-XNUMX:n ja Mistral Largen merkkikapasiteetin suhteen.

Toisin sanoen Meta.ai:n ja Mistral Largen Llama-3:n kaltaiset tekoälyt voivat romahtaa pitkän keskustelun jälkeen tai pyytää paljon ennen kuin tämä kevyt malli alkaa kamppailla.

Yksi Phi-3 Minin merkittävimmistä eduista on sen kyky sovittaa ja toimia tyypillisessä älypuhelimessa. Microsoft testasi mallia iPhone 14:ssä, ja se toimi ilman ongelmia, tuottaen 14 merkkiä sekunnissa. Phi-3 Mini vaatii vain 1.8 Gt VRAM-muistia, joten se on kevyt ja tehokas vaihtoehto käyttäjille, joilla on tarkempia vaatimuksia.

Vaikka Phi-3 Mini ei ehkä ole yhtä sopiva huippuluokan koodaajille tai ihmisille, joilla on laajat vaatimukset, se voi olla tehokas vaihtoehto käyttäjille, joilla on erityistarpeita. Esimerkiksi startup-yritykset, jotka tarvitsevat chatbotin, tai ihmiset, jotka hyödyntävät LLM:itä data-analyysiin, voivat käyttää Phi-3 Miniä tehtäviin, kuten tietojen järjestämiseen, tiedon poimimiseen, matemaattisten päättelyjen tekemiseen ja agenttien rakentamiseen. Jos mallille annetaan Internet-yhteys, siitä voi tulla melko tehokas, mikä kompensoi sen kyvyttömyyden reaaliaikaisilla tiedoilla.

Phi-3 Mini saavuttaa korkeat testitulokset, koska Microsoft keskittyy kuratoimaan tietojoukonsa mahdollisimman hyödyllisillä tiedoilla. Laajempi Phi-perhe ei itse asiassa ole hyvä asiatietoa vaativiin tehtäviin, mutta korkea päättelykyky asettaa heidät suurten kilpailijoiden edelle. Phi-3 Medium (14 miljardin parametrin malli) päihittää jatkuvasti tehokkaat LLM:t, kuten GPT-3.5 – ChatGPT:n ilmaista versiota käyttävä LLM – ja Mini-versio päihittää tehokkaat mallit, kuten Mixtral-8x7B, useimmissa synteettisissä vertailuissa.

On kuitenkin syytä huomata, että Phi-3 ei ole avoimen lähdekoodin, kuten edeltäjänsä Phi-2. Sen sijaan se on an avoin malli, mikä tarkoittaa, että se on saatavilla ja käytettävissä, mutta sillä ei ole samaa avoimen lähdekoodin lisensointia kuin Phi-2:lla, mikä mahdollistaa laajemman käytön ja kaupalliset sovellukset.

Tulevina viikkoina Microsoft ilmoitti julkaisevansa lisää Phi-3-perheen malleja, mukaan lukien Phi-3 Small (7 miljardia parametria) ja edellä mainittu Phi-3 Medium.

Microsoft on asettanut Phi-3 Minin saataville Azure AI Studiossa, Hugging Facessa ja Ollamassa. Malli on ohjeiden mukaan viritetty ja optimoitu ONNX Runtimelle Windows DirectML:n tuella sekä eri alustojen välisellä tuella eri grafiikkasuorittimilla, prosessoreilla ja jopa mobiililaitteilla.

Pysy ajan tasalla kryptouutisista, saat päivittäiset päivitykset postilaatikkoosi.

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?