Generatieve data-intelligentie

Meta onthult Llama-3: we hebben het nieuwe top-open-source AI-model op de proef gesteld – ontsleutelen

Datum:

Meta heeft Llama 3 uitgebracht, het meest geavanceerde open source grote taalmodel dat momenteel beschikbaar is. Het bouwt voort op de basis die is gelegd door zijn voorganger, Llama 2, en kwam als een verrassing, aangezien geruchten suggereerden dat de release zou volgende maand plaatsvinden.

Met zijn open source-roots speelde Llama-2 een belangrijke rol in de gelijktijdige ontwikkeling van andere krachtige modellen zoals Gemengd, Alpaca, Vicuña en WizardLM. Nu belooft Llama-3 deze mogelijkheden nog verder te brengen en functionaliteiten te bieden die vergelijkbaar zijn met die van OpenAI's huidige vlaggenschip AI-model GPT-4.

meta juichte de vrijlating van donderdag toe als “de volgende generatie van ons state-of-the-art open source grote taalmodel.” De technologiegigant heeft zoveel vertrouwen in zijn capaciteiten dat Llama 3 de drijvende kracht is Meta-AI, die op zijn beurt werd toegevoegd aan bijna alle bedrijfsgegevens van het bedrijf enorm populaire apps: Instagram, Facebook en WhatsApp. Het is in bepaalde landen beschikbaar gemaakt, maar gebruikers in andere regio's hadden er via VPN toegang toe.

De Chatbot-interface van Meta AI is vergelijkbaar met ChatGPT Plus en is gratis.

“We upgraden Meta AI met ons nieuwe, ultramoderne Llama 3 AI-model, dat we open source maken”, zegt Mark Zuckerberg zei in een Facebook-bericht. “Met dit nieuwe model geloven wij dat Meta AI nu de meest intelligente AI-assistent is die je vrijelijk kunt gebruiken.”

decoderen kon de nieuwe AI testen en ontdekte dat deze net zo capabel was als ChatGPT-Plus zonder betaald abonnement. Het kan afbeeldingen en animaties genereren, code produceren en coherente, contextueel relevante antwoorden bieden. De nieuwe chatbot heeft ook toegang tot internet, maar kan nog steeds niet op tegen de mogelijkheden van gespecialiseerde oplossingen als Perplexity.

Misschien is het enige nadeel dat het huidige contextvenster van Llama-3 beperkt is tot 8K tokens – ongeveer 6,000 woorden.

Meta heeft wel een Llama-70-model met 3 miljard parameters uitgebracht, maar het gebruik ervan zou veel rekenkracht vereisen - waarschijnlijk een heel rek met GPU's. Volgens synthetische benchmarks verslaat dit model Gemini 1.5 Pro en Claude 3 Sonnet.

Er is ook een parametermodel van 8 miljard beschikbaar, dat lokaal kan worden uitgevoerd op GPU's van consumentenkwaliteit. Deze verslaat Google's Gemma en Mistral 7B in verschillende synthetische benchmarks. Het model is nog niet opgenomen in de LLM Arena, dus er is nog geen subjectieve ELO-score te melden.

Llama 3 versus andere AI LLM's
Afbeelding: Meta

Beide modellen kunnen tegen lagere kosten ook in cloud-instances worden uitgevoerd.

“We streven ernaar om Llama 3 op een verantwoorde manier te ontwikkelen, en we bieden verschillende hulpmiddelen aan om anderen te helpen het ook op een verantwoorde manier te gebruiken”, aldus Meta. Dit omvat de introductie van nieuwe vertrouwens- en veiligheidstools zoals Llama Guard 2, Code Shield en CyberSec Eval 2.

Meta zegt dat het de komende maanden van plan is nieuwe mogelijkheden, langere contextvensters, extra modelgroottes en verbeterde prestaties te introduceren. Het onderzoekspaper van Llama 3 zal ook worden gedeeld.

“Meta AI, gebouwd met Llama 3-technologie, is nu een van 's werelds toonaangevende AI-assistenten die je intelligentie kunnen vergroten en je werklast kunnen verlichten, zodat je kunt leren, dingen gedaan kunt krijgen, inhoud kunt creëren en verbinding kunt maken om het meeste uit elk moment te halen ”, zei Meta.

Meta voegde eraan toe dat het ook een enorm parametermodel van 400 miljard traint, dat naar verwachting later dit jaar zal worden vrijgegeven. Dit model – waarschijnlijk vergelijkbaar met Claude Opus of de nieuwste versie van GPT-4.5 – zou wel eens het krachtigste open-sourcemodel tot nu toe kunnen zijn. Als de geschiedenis zich herhaalt, zal deze ook dienen als basis voor een nieuwe generatie verfijnde modellen die Llama-3 in algehele kwaliteit zullen verslaan – en de concurrentie met de toonaangevende close-source modellen zullen vergroten.

Rijden op de lama

decoderen testte Llama-3 in Meta AI om te zien of het zo goed was als Zuck zegt. Kortom, Llama-3 heeft een aantal opvallende kenmerken en mogelijkheden geïntroduceerd en zou een geweldig fundamenteel model moeten zijn waarop de open-sourcegemeenschap kan voortbouwen.

Contentmoderatie

Llama-3 toont een sterke toewijding aan contentmoderatie. Het weigerde consequent schadelijke racistische inhoud te genereren, zelfs als het werd geconfronteerd met gangbare jailbreaktechnieken.

Toen het model bijvoorbeeld werd gevraagd om instructies over hoe een vrouw te verleiden, gaf het algemene maar nuttige antwoorden. Toen hem echter werd gevraagd om instructies over hoe de vrouw van een beste vriendin te verleiden, weigerde het model resoluut een antwoord te geven.

Afbeeldingen en animatie

Net als ChatGPT-Plus kan Meta AI met Llama-3 afbeeldingen genereren. Het gaat echter nog een stap verder door de optie aan te bieden om ze te animeren – een functie die niet beschikbaar is in ChatGPT of Gemini.

De afbeeldingen gegenereerd door Meta AI met Llama-3 zijn realistischer dan die geproduceerd door Dalle-3, maar ze voldoen niet aan de kwaliteit van de afbeeldingen gegenereerd door Google's aankomende ImageFX.

Codeermogelijkheden

Llama-3 heeft bewezen zeer bedreven te zijn in coderen. Toen het model een uniek en slecht uitgelegd spelidee kreeg, kon het in twee pogingen de benodigde Python-code genereren, wat resulteerde in een functioneel spel. De eerste opname gaf ons een globaal idee van hoe we de game moesten maken, maar er ontstond werkende code nadat we duidelijk hadden gemaakt dat we die in Python nodig hadden.

De game was functioneel, maar miste een paar kleine details, zoals het opnieuw opstarten nadat een speler had gewonnen. Hetzelfde gebeurde echter met andere chatbots.

We vonden Claude 3 Sonnet het beste hulpmiddel voor deze taak, gevolgd door Llama 3. GPT-4 zakt naar de derde plaats. Verschillende gebruikers kunnen echter verschillende resultaten krijgen.

Hier is een pastebin met de broncodes gegenereerd door Llama3, Claude en ChatGPT voor degenen die geïnteresseerd zijn om ze uit te testen.

Politieke neutraliteit

Het model streeft naar politieke neutraliteit, zoals blijkt uit de antwoorden op vragen over het kapitalisme en het communisme. De reacties waren structureel vergelijkbaar en gaven een introductie, voor- en nadelen voor elk systeem.

Dit patroon van neutraliteit werd ook waargenomen in antwoorden op vragen als ‘Wat is een man?’ en “Wat is een vrouw?”

Toch zijn de reacties enigszins pro-kapitalisme en links georiënteerd, wat niet verrassend is omdat het de meest gemeenschappelijke politieke tendens tussen grote taalmodellen.

Logische redenering

Llama-3 heeft krachtige logische redeneercapaciteiten getoond. Bij tests met complexe LSAT-vragen die gebruikers vaak in verwarring brengen, leverde het model niet alleen correcte antwoorden op, maar bood het ook duidelijke en redelijke verklaringen.

Lange-promptlimieten

Ondanks zijn vele sterke punten heeft Llama-3 moeite met lange aanwijzingen. Toen het model een lange prompt kreeg van ongeveer anderhalve pagina context (die kan worden opgenomen door modellen als GPT-4, Claude of Mistral), retourneerde het een foutmelding.

Taalbegrip

Het model toont een sterk begrip van verschillende talen. Toen hem werd gevraagd een Spaanse slogan te vertalen, leverde deze niet alleen een nauwkeurige vertaling op, maar bood hij ook context om de slogan beter te begrijpen.

Conclusie

Als chatbotinterface kan Meta AI (die wordt aangedreven door Llama3) concurreren met ChatGPT Plus en is over het algemeen een goede keuze.

Op een meer technisch niveau is LLama3 als LLM goed genoeg om in verschillende scenario's te concurreren met GPT-4, waarbij het alleen verliest in termen van tokencontextmogelijkheden en Retrieval Augmented Generations (in feite informatie ophalen uit een specifieke dataset die door de gebruiker wordt verstrekt). Dit kan belangrijk zijn voor technisch onderlegde gebruikers, maar voor de gewone mens is dit misschien geen groot probleem.

Als u ChatGPT voornamelijk gebruikt om afbeeldingen te genereren met Dall-E, kunt u overwegen uw abonnement op te zeggen, omdat de mogelijkheden voor het genereren van afbeeldingen en animaties van Llama-3 vergelijkbaar zijn. Als u echter ook ondersteuning nodig heeft voor lange prompts, is Llama-3 wellicht niet de beste keuze voor u en kunt u overwegen om bij ChatGPT-Plus te blijven.

Incidentele gebruikers kunnen merken dat Llama-3 aan hun behoeften voldoet zonder dat een betaald lidmaatschap vereist is.

Voor taken die veel internetonderzoek vereisen, kan ChatGPT Plus of Perplexity geschikter zijn.

Ten slotte, als je focus op coderen ligt, kan Llama-3 een goed alternatief zijn, hoewel er andere gespecialiseerde tools beschikbaar zijn. Het feit dat Llama-3 gratis is, is een aanzienlijk voordeel.

Bewerkt door Ryan Ozawa.

Blijf op de hoogte van cryptonieuws, ontvang dagelijkse updates in je inbox.

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?