Generativní datová inteligence

Tento ultralehký model umělé inteligence se vejde do vašeho telefonu a dokáže porazit ChatGPT – dešifrovat

Datum:

Microsoft dnes Celek that it has released “the most capable and cost-effective small language models (SLMs) available,” saying Phi-3—the third iteration of its Phi family of Small Language Models (SLMs)—outperforms comparably-sized models and a few larger ones.

Malý jazykový model (SLM) je typ modelu umělé inteligence, který je navržen tak, aby byl extrémně účinný při provádění konkrétních úloh souvisejících s jazykem. Na rozdíl od velkých jazykových modelů (LLM), které se dobře hodí pro širokou škálu obecných úkolů, jsou SLM postaveny na menším datovém souboru, aby byly efektivnější a nákladově efektivnější pro konkrétní případy použití.

Phi-3 comes in different versions, Microsoft explained, with the smallest being Phi-3 Mini, a 3.8 billion parameter model trained on 3.3 trillion tokens. Despite its comparatively small size—Llama-3’s corpus weighs in over 15 bilionu tokens of data—Phi-3 Mini is still capable of handling 128K tokens of context. This makes it comparable to GPT-4 and beats Llama-3 and Mistral Large in terms of token capacity.

Jinými slovy, monstra umělé inteligence jako Llama-3 na Meta.ai a Mistral Large by se po dlouhém chatování mohla zhroutit nebo se mohla popohánět dříve, než tento lehký model začne bojovat.

Jednou z nejvýznamnějších výhod Phi-3 Mini je jeho schopnost pasovat a fungovat na typickém smartphonu. Microsoft testoval model na iPhone 14 a běžel bez problémů a generoval 14 tokenů za sekundu. Provoz Phi-3 Mini vyžaduje pouze 1.8 GB paměti VRAM, což z něj činí lehkou a efektivní alternativu pro uživatele se zaměřenějšími požadavky.

I když Phi-3 Mini nemusí být tak vhodný pro špičkové kodéry nebo lidi s širokými požadavky, může být efektivní alternativou pro uživatele se specifickými potřebami. Například startupy, které potřebují chatbota nebo lidé využívající LLM pro analýzu dat, mohou Phi-3 Mini používat pro úkoly, jako je organizace dat, získávání informací, matematické uvažování a vytváření agentů. Pokud má model přístup k internetu, může se stát docela výkonným a kompenzovat nedostatek schopností informacemi v reálném čase.

Phi-3 Mini dosahuje vysokého skóre testů díky zaměření Microsoftu na kurátorství své datové sady s co nejužitečnějšími informacemi. Širší rodina Phi ve skutečnosti není dobrá pro úkoly, které vyžadují faktické znalosti, ale vysoké schopnosti uvažování je staví nad hlavní konkurenty. Phi-3 Medium (model se 14 miliardami parametrů) trvale poráží výkonné LLM jako GPT-3.5 — LLM pohánějící bezplatnou verzi ChatGPT — a verze Mini poráží výkonné modely jako Mixtral-8x7B ve většině syntetických benchmarků.

Za zmínku však stojí, že Phi-3 není open source jako jeho předchůdce Phi-2. Místo toho je to otevřený model, což znamená, že je přístupný a dostupný pro použití, ale nemá stejné licencování open source jako Phi-2, což umožňuje širší využití a komerční aplikace.

V nadcházejících týdnech Microsoft uvedl, že vydá další modely z rodiny Phi-3, včetně Phi-3 Small (7 miliard parametrů) a výše zmíněného Phi-3 Medium.

Microsoft zpřístupnil Phi-3 Mini v Azure AI Studio, Hugging Face a Ollama. Model je vyladěný podle instrukcí a optimalizován pro ONNX Runtime s podporou Windows DirectML a také s podporou napříč platformami napříč různými GPU, CPU a dokonce i mobilním hardwarem.

Mějte přehled o krypto novinkách, dostávejte denní aktualizace do vaší schránky.

spot_img

Nejnovější inteligence

spot_img

piš si s námi

Ahoj! Jak vám mohu pomoci?