Generative Data Intelligence

Η Meta αποκαλύπτει το Llama-3—Δοκιμάζουμε το νέο κορυφαίο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα – Αποκρυπτογράφηση

Ημερομηνία:

Meta has released of Llama 3, the most advanced open source large language model currently available. It builds upon the foundation laid by its predecessor, Llama 2, and came as a surprise considering that rumors suggested that the release would happen next month.

With its open-source roots, Llama-2 was instrumental in the concurrent development of other powerful models such as Mixtral, Alpaca, Vicuna, and WizardLM. Now, Llama-3 promises to take these capabilities even further, offering functionalities comparable to those of OpenAI’s current flagship AI model GPT-4.

Meta hailed Thursday’s release as “the next generation of our state-of-the-art open source large language model.” So confident is the tech giant in its capabilities, Llama 3 is powering Meta AI, which in turn was added to almost all of the company’s massively popular apps: Instagram, Facebook, and WhatsApp. It has been made available in select countries, but users in other regions could access it via VPN.

Η διεπαφή Chatbot του Meta AI είναι συγκρίσιμη με το ChatGPT Plus—και είναι δωρεάν.

“We’re upgrading Meta AI with our new state-of-the-art Llama 3 AI model, which we’re open sourcing,” Mark Zuckerberg είπε in a Facebook post. “With this new model, we believe Meta AI is now the most intelligent AI assistant that you can freely use.”

Αποκρυπτογράφηση μπόρεσε να δοκιμάσει τη νέα τεχνητή νοημοσύνη και βρήκε ότι ήταν εξίσου ικανό με το ChatGPT-Plus χωρίς συνδρομή επί πληρωμή. Μπορεί να δημιουργήσει εικόνες και κινούμενα σχέδια, να παράγει κώδικα και να παρέχει συνεκτικές, σχετικές με τα συμφραζόμενα απαντήσεις. Το νέο chatbot μπορεί επίσης να έχει πρόσβαση στο διαδίκτυο, αλλά εξακολουθεί να μην ταιριάζει με τις δυνατότητες εξειδικευμένων λύσεων όπως το Perplexity.

Ίσως το μόνο μειονέκτημα είναι ότι το τρέχον παράθυρο περιβάλλοντος του Llama-3 περιορίζεται σε 8K διακριτικά —περίπου 6,000 λέξεις.

Η Meta κυκλοφόρησε ένα μοντέλο Llama-70 παραμέτρων 3 δισεκατομμυρίων, αλλά η χρήση του θα απαιτούσε μεγάλη υπολογιστική ισχύ—πιθανότατα ένα ολόκληρο ράφι GPU. Σύμφωνα με τα συνθετικά σημεία αναφοράς, αυτό το μοντέλο ξεπερνά τα Gemini 1.5 Pro και Claude 3 Sonnet.

Υπάρχει επίσης διαθέσιμο μοντέλο παραμέτρων 8 δισεκατομμυρίων, το οποίο μπορεί να εκτελεστεί τοπικά σε GPU καταναλωτικής ποιότητας. Αυτό ξεπερνά το Gemma και το Mistral 7B της Google σε διάφορα συνθετικά σημεία αναφοράς. Το μοντέλο δεν έχει ακόμη καταχωρηθεί στο LLM Arena, επομένως δεν υπάρχει υποκειμενική βαθμολογία ELO για αναφορά ακόμα.

Llama 3 εναντίον άλλων AI LLM
Εικόνα: Meta

Και τα δύο μοντέλα μπορούν επίσης να εκτελεστούν σε περιπτώσεις cloud με χαμηλότερο κόστος.

«Είμαστε αφοσιωμένοι στην ανάπτυξη του Llama 3 με υπεύθυνο τρόπο και προσφέρουμε διάφορους πόρους για να βοηθήσουμε και άλλους να το χρησιμοποιήσουν με υπευθυνότητα», δήλωσε ο Meta. Αυτό περιλαμβάνει την εισαγωγή νέων εργαλείων εμπιστοσύνης και ασφάλειας, όπως το Llama Guard 2, το Code Shield και το CyberSec Eval 2.

Τους επόμενους μήνες, η Meta λέει ότι σχεδιάζει να παρουσιάσει νέες δυνατότητες, μεγαλύτερα παράθυρα περιβάλλοντος, πρόσθετα μεγέθη μοντέλων και βελτιωμένη απόδοση. Θα κοινοποιηθεί επίσης η ερευνητική εργασία Llama 3.

«Το Meta AI, κατασκευασμένο με την τεχνολογία Llama 3, είναι τώρα ένας από τους κορυφαίους βοηθούς τεχνητής νοημοσύνης στον κόσμο που μπορεί να ενισχύσει τη νοημοσύνη σας και να ελαφρύνει το φόρτο σας—βοηθώντας σας να μάθετε, να κάνετε πράγματα, να δημιουργήσετε περιεχόμενο και να συνδεθείτε για να αξιοποιήσετε στο έπακρο την κάθε στιγμή », είπε ο Μέτα.

Η Meta πρόσθεσε ότι εκπαιδεύει επίσης ένα τεράστιο μοντέλο παραμέτρων 400 δισεκατομμυρίων, το οποίο αναμένεται να κυκλοφορήσει αργότερα μέσα στο έτος. Αυτό το μοντέλο—πιθανότατα συγκρίσιμο με το Claude Opus ή την πιο πρόσφατη έκδοση του GPT-4.5—θα μπορούσε να είναι το πιο ισχυρό μοντέλο ανοιχτού κώδικα μέχρι σήμερα. Εάν η Ιστορία επαναληφθεί, θα χρησιμεύσει επίσης ως βάση για μια νέα γενιά μοντέλων με λεπτή ρύθμιση που θα νικήσει το Llama-3 σε συνολική ποιότητα—και θα τονώσει τον ανταγωνισμό έναντι των κορυφαίων μοντέλων κοντινής πηγής.

Ιππασία στη Λάμα

Αποκρυπτογράφηση δοκίμασε το Llama-3 μέσα στο Meta AI για να δει αν ήταν τόσο καλό όσο λέει ο Zuck. Εν ολίγοις, το Llama-3 έχει εισαγάγει μια σειρά από αξιοσημείωτα χαρακτηριστικά και δυνατότητες και θα πρέπει να είναι ένα εξαιρετικό θεμελιώδες μοντέλο πάνω στο οποίο η κοινότητα ανοιχτού κώδικα μπορεί να επαναλάβει.

Μετριασμός περιεχομένου

Το Llama-3 επιδεικνύει μια ισχυρή δέσμευση στη μετριοπάθεια περιεχομένου. Αρνήθηκε σταθερά να δημιουργήσει επιβλαβές φυλετικό περιεχόμενο, ακόμη και όταν αντιμετώπιζε κοινές τεχνικές jailbreak.

Για παράδειγμα, όταν ζητήθηκε από το μοντέλο οδηγίες για το πώς να αποπλανήσει μια γυναίκα, έδωσε γενικές αλλά χρήσιμες απαντήσεις. Ωστόσο, όταν του ζητήθηκε οδηγίες για το πώς να αποπλανήσει τη σύζυγο ενός καλύτερου φίλου, το μοντέλο αρνήθηκε κατηγορηματικά να δώσει μια απάντηση.

Εικόνες και κινούμενα σχέδια

Παρόμοια με το ChatGPT-Plus, το Meta AI με το Llama-3 είναι ικανό να δημιουργεί εικόνες. Ωστόσο, προχωρά αυτή η δυνατότητα ένα βήμα παραπέρα, προσφέροντας την επιλογή να τα κινούμε—μια δυνατότητα που δεν είναι διαθέσιμη στο ChatGPT ή στο Gemini.

Οι εικόνες που δημιουργούνται από το Meta AI με το Llama-3 είναι πιο ρεαλιστικές από αυτές που παράγονται από το Dalle-3, αλλά υπολείπονται της ποιότητας των εικόνων που δημιουργούνται από το επερχόμενο ImageFX της Google.

Δυνατότητες κωδικοποίησης

Το Llama-3 έχει αποδειχθεί πολύ ικανό στην κωδικοποίηση. Όταν παρουσιάστηκε μια μοναδική και κακώς επεξηγημένη ιδέα παιχνιδιού, το μοντέλο μπόρεσε να δημιουργήσει τον απαραίτητο κώδικα Python σε δύο προσπάθειες, με αποτέλεσμα ένα λειτουργικό παιχνίδι. Η πρώτη λήψη μας έδωσε μια πρόχειρη ιδέα για το πώς να δημιουργήσουμε το παιχνίδι, αλλά δημιούργησε κώδικα εργασίας αφού ξεκαθαρίσαμε ότι τον χρειαζόμασταν στην Python.

Το παιχνίδι ήταν λειτουργικό αλλά έχασε μερικές μικρές λεπτομέρειες, όπως η επανεκκίνηση μετά τη νίκη ενός παίκτη. Το ίδιο συνέβη και με άλλα chatbots, όμως.

Βρήκαμε ότι το Claude 3 Sonnet είναι το καλύτερο εργαλείο για αυτήν την εργασία, ακολουθούμενο από το Llama 3. Το GPT-4 πέφτει στην τρίτη θέση. Ωστόσο, διαφορετικοί χρήστες ενδέχεται να έχουν διαφορετικά αποτελέσματα.

Εδώ είναι μία pastebin with the source codes generated by Llama3, Claude, and ChatGPT for those interested in testing them out.

Πολιτική ουδετερότητα

Το μοντέλο στοχεύει στην πολιτική ουδετερότητα, όπως αποδεικνύεται από τις απαντήσεις του σε ερωτήσεις σχετικά με τον καπιταλισμό και τον κομμουνισμό. Οι απαντήσεις ήταν δομικά παρόμοιες, παρέχοντας μια εισαγωγή, τα πλεονεκτήματα και τα μειονεκτήματα για κάθε σύστημα.

Αυτό το πρότυπο ουδετερότητας παρατηρήθηκε επίσης σε απαντήσεις σε ερωτήσεις όπως «Τι είναι ένας άντρας;» και «Τι είναι γυναίκα;»

Still, its responses are slightly pro-capitalism and left-leaning, which is unsurprising as it’s the most common political tendency among large language models.

Λογική λογική

Το Llama-3 έχει δείξει ισχυρές λογικές συλλογιστικές ικανότητες. Όταν δοκιμάστηκε με σύνθετες ερωτήσεις LSAT που συχνά μπερδεύουν τους χρήστες, το μοντέλο όχι μόνο παρείχε σωστές απαντήσεις αλλά πρόσφερε και σαφείς και λογικές εξηγήσεις.

Όρια μακροπρόθεσμα

Παρά τα πολλά δυνατά του σημεία, το Llama-3 παλεύει με μεγάλες προτροπές. Όταν παρουσιάζεται με μια μακροσκελή προτροπή περίπου μιάμιση σελίδας περιβάλλοντος—το οποίο μπορεί να απορροφηθεί από μοντέλα όπως το GPT-4, το Claude ή το Mistral—το μοντέλο επέστρεψε ένα μήνυμα σφάλματος.

Γλωσσική κατανόηση

Το μοντέλο δείχνει μια ισχυρή κατανόηση διαφορετικών γλωσσών. Όταν του ζητήθηκε να μεταφράσει ένα ισπανικό σύνθημα, όχι μόνο παρείχε μια ακριβή μετάφραση αλλά πρόσφερε και πλαίσιο για την καλύτερη κατανόηση του σλόγκαν.

Συμπέρασμα

Ως διεπαφή chatbot, το Meta AI (το οποίο υποστηρίζεται από το Llama3) μπορεί να ανταγωνιστεί το ChatGPT Plus και είναι συνολικά μια εξαιρετική επιλογή.

Σε πιο τεχνικό επίπεδο, το LLama3 ως LLM είναι αρκετά καλό για να ανταγωνίζεται το GPT-4 σε διαφορετικά σενάρια, χάνοντας μόνο ως προς τις δυνατότητες πλαισίου διακριτικών και τις επαυξημένες γενιές ανάκτησης (βασικά αντλώντας πληροφορίες από ένα συγκεκριμένο σύνολο δεδομένων που παρέχεται από τον χρήστη). Αυτό μπορεί να είναι σημαντικό για χρήστες που γνωρίζουν την τεχνολογία, αλλά μπορεί να μην είναι μεγάλο θέμα για τον καθημερινό άνθρωπο.

Εάν χρησιμοποιείτε κυρίως το ChatGPT για τη δημιουργία εικόνων με το Dall-E, ίσως θελήσετε να σκεφτείτε να ακυρώσετε τη συνδρομή σας, καθώς οι δυνατότητες δημιουργίας εικόνων και κινούμενων εικόνων του Llama-3 είναι συγκρίσιμες. Ωστόσο, εάν χρειάζεστε επίσης υποστήριξη για μεγάλες προτροπές, το Llama-3 μπορεί να μην είναι η καλύτερη επιλογή για εσάς και ίσως θέλετε να εξετάσετε το ενδεχόμενο να παραμείνετε στο ChatGPT-Plus.

Περιστασιακές χρήστες μπορεί να διαπιστώσουν ότι το Llama-3 καλύπτει τις ανάγκες τους χωρίς να απαιτείται συνδρομή επί πληρωμή.

Για εργασίες που απαιτούν έντονη έρευνα στο διαδίκτυο, το ChatGPT Plus ή το Perplexity μπορεί να είναι πιο κατάλληλο.

Τέλος, εάν η εστίασή σας είναι στην κωδικοποίηση, το Llama-3 θα μπορούσε να είναι μια καλή εναλλακτική, αν και υπάρχουν διαθέσιμα άλλα εξειδικευμένα εργαλεία. Το γεγονός ότι το Llama-3 είναι ελεύθερο είναι ένα σημαντικό πλεονέκτημα.

Επιμέλεια: Ράιαν Οζάουα.

Μείνετε ενημερωμένοι για τα νέα κρυπτογράφησης, λάβετε καθημερινές ενημερώσεις στα εισερχόμενά σας.

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?