Microsoft Shrinks AI Down To Pocket Size With Phi-3 Mini

A Microsoft azt állítja, hogy könnyűsúlyú Phi-3 Mini AI modelljének legújabb megtestesülése vetekszik a versenytársakkal, például a GPT-3.5-tel, miközben elég kicsi ahhoz, hogy egy telefonra is bevezessük.

A Phi-3 Mini egy 3.8 milliárd paraméteres nyelvi modell, amelyet 3.3 billió tokenre képeztek ki. Ez a szám magasabb a Phi-2.7 2 milliárd paraméterénél, amelyet a Microsoft Bevezetett decemberben 2023.

Ahelyett, hogy a lehető legtöbbet belelapátolta volna a képzési modellekbe, a hangsúly az érvelésen volt. A Microsoft azt mondta: „Például egy Premier League-beli meccs eredménye egy adott napon jó edzési adat lehet a határmodellek számára, de el kell távolítanunk ezeket az információkat, hogy több modellkapacitás maradjon az „okoskodás” számára a mini méretű modelleknél. .”

A célzott megközelítés azt jelenti, hogy bár a Phi-3 nem biztos, hogy rendelkezik annyi tudással, mint versenytársai, de legalább olyan jó, ha nem jobb, ha az érvelésről van szó, legalábbis ezt állítja a Microsoft. Az a kutatási papír [PDF], a Microsoft megjegyzi, hogy ez lehetővé tette a kis nyelvi modelljének, hogy „elérje a magas képességű modellek szintjét, mint például a GPT-3.5 vagy a Mixtral, mindössze 3.8 B összparaméterrel (míg a Mixtral például 45 B összes paraméterrel rendelkezik).

A kutatás azt is megjegyzi, hogy a felhasznált képzési adatok „erősen szűrt webes adatokból … különböző nyílt internetes forrásokból” és LLM által generált adatokból álltak. Az LLM-ek képzéséhez használt adatforrások tárgya több per.

A Phi-3 Mini kis mérete azt jelenti, hogy okostelefonon offline is működik. A kutatók azt mondták, hogy körülbelül 1.8 GB memóriát lehet elfoglalni, és offline módban is kipróbálták egy iPhone 14-en, amelyen egy A16 Bionic chip natívan fut az eszközön. Az újságban a kutatók képernyőképeket mutatnak be arról, hogy a Phi-3 Mini verset ír, és tennivalókat javasol Houstonban.

A kutatók rávilágítanak a nyelvi megértésre és érvelésre való összpontosítás árnyoldalaira is. „A modell egyszerűen nem képes túl sok „tényismeretet” tárolni, ami bizonyos mértékig mérsékelhető egy keresőmotorral való kiegészítéssel. Ez azonban elveszítené az offline futtatás értelmét.

A nyelv jelenleg leginkább az angolra korlátozódik, és a legtöbb LLM-ben rejlő problémák – hallucinációk, torzítás erősítése és nem megfelelő tartalom generálása – a Phi-3 Miniben is megtalálhatók.

A kutatók a következőket mondják az újságban: „Jelentős munka áll előttünk, hogy teljes mértékben megbirkózzunk ezekvel a kihívásokkal.”

A nagyobb modelleket – viszonylagosan szólva – a Phi-3 Small és Phi-3 Medium formájában is bejelentették, 7, illetve 14 milliárd paraméterrel.

Victor Botev, műszaki igazgató és társalapítója Iris.ai, a következőket mondta nekünk: „A Microsoft Phi-3 modellre vonatkozó bejelentése a mesterséges intelligencia fejlesztésének folyamatos trendje. Az egyre nagyobb modellek üldözése helyett a Microsoft gondosabban kezelt adatokkal és speciális képzéssel rendelkező eszközöket fejleszt. Ez jobb teljesítményt és érvelési képességeket tesz lehetővé a több billió paraméterrel rendelkező modellek hatalmas számítási költségei nélkül. Ennek az ígéretnek a teljesítése azt jelentené, hogy lebontják az AI-megoldásokat kereső vállalkozások előtt álló hatalmas elfogadási korlátot.

„A Microsoft bölcsen túllép a „minél nagyobb, annál jobb” gondolkodásmódon. A széles körben elterjedt üzleti és fogyasztói AI-alkalmazások esetében a megvalósíthatóság és a specifikusság fontosabb, mint a hatalmas paraméterek száma. Az olyan modellek, mint a Phi-3, egyértelműen bizonyítják, hogy a megfelelő adat- és képzési megközelítéssel a fejlett AI-képességekhez nem kell egyre nagyobb modelleket készíteni – ez döntő tényező azoknál a vállalkozásoknál, ahol a költség-minőség arány kritikus.” ®

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://go.theregister.com/feed/www.theregister.com/2024/04/23/microsoft_phi_3_mini/

Generatív adatintelligencia

A Microsoft zsebméretűre csökkenti a mesterséges intelligenciát a Phi-3 Mini segítségével

A Blackrock BUIDL Alapja megelőzte Franklin Templetont, és a legnagyobb RWA tokenizált kínálata lett

Option2 Kereskedelem és optimizmus – A 3 legjobb módszer az Ethereum skálázhatóságának felhasználására az ökoszisztéma növelésére

Legújabb intelligencia

Between Realities VR Podcast ft Maeva Sponbergs of Beyond Frames

A mobil bányászat felemelkedése: A BlockDAG X1 App béta verziója megváltoztatja a játékot, kihívást jelent a Bitcoin és a Solana piac számára

Kereskedés 101 Revealed: Átfogó oktatóanyagok a Forexről és… – CryptoInfoNet

Az Epic Satoshi Spurs új Runes Tokeneket dob piacra 88 millió dolláros piaci kapitalizációval

A Coinbase vezérigazgatója, Brian Armstrong szerint a Layer-2 megoldások számos felhasználási esetet eredményeznek a kriptogazdaságban – A Daily Hodl

A JPMorgan Chase 448,000,000 XNUMX XNUMX dolláros bírságot fizetett az amerikai szabályozóknak, amiért nem figyelték meg a bank globális kereskedési helyszínein végrehajtott tranzakciók milliárdjait – The Daily Hodl

Beszélj velünk