Generatywna analiza danych

Meta przedstawia Llamę-3 — testujemy nowy, najlepszy model sztucznej inteligencji typu open source — odszyfruj

Data:

Meta wypuściła Llamę 3, najbardziej zaawansowany obecnie dostępny model wielkojęzykowy typu open source. Opiera się na fundamentach położonych przez poprzedniczkę, Llamę 2, i była zaskoczeniem, biorąc pod uwagę, że sugerowały to plotki premiera nastąpi w przyszłym miesiącu.

Dzięki swoim korzeniom typu open source Llama-2 odegrała kluczową rolę w równoczesnym rozwoju innych potężnych modeli, takich jak Mieszany, Alpaka, Wigoń i WizardLM. Teraz Llama-3 obiecuje jeszcze bardziej rozszerzyć te możliwości, oferując funkcjonalności porównywalne z obecnymi flagowymi modelami AI OpenAI GPT-4.

Meta z zadowoleniem przyjął czwartkowe wydanie jako „następną generację naszego najnowocześniejszego modelu dużego języka o otwartym kodzie źródłowym”. Tak pewny jest technologiczny gigant w swoich możliwościach, że Llama 3 napędza Meta sztuczna inteligencja, który z kolei został dodany do niemal wszystkich produktów firmy niezwykle popularne aplikacje: Instagram, Facebook i WhatsApp. Został udostępniony w wybranych krajach, ale użytkownicy w innych regionach mogli uzyskać do niego dostęp za pośrednictwem VPN.

Interfejs Chatbota Meta AI jest porównywalny z ChatGPT Plus – i jest bezpłatny.

„Uaktualniamy Meta AI za pomocą naszego nowego, najnowocześniejszego modelu sztucznej inteligencji Llama 3, z którego korzystamy na zasadach open source” – Mark Zuckerberg powiedziany w poście na Facebooku. „Wierzymy, że dzięki temu nowemu modelowi Meta AI jest teraz najinteligentniejszym asystentem AI, z którego możesz swobodnie korzystać”.

Odszyfruj był w stanie przetestować nową sztuczną inteligencję i stwierdził, że jest tak samo wydajna jak ChatGPT-Plus bez płatnej subskrypcji. Może generować obrazy i animacje, tworzyć kod i zapewniać spójne, kontekstowo odpowiednie odpowiedzi. Nowy chatbot może także uzyskać dostęp do Internetu, jednak nadal nie dorównuje możliwościom wyspecjalizowanych rozwiązań, takich jak Perplexity.

Być może jedyną wadą jest to, że obecne okno kontekstowe Lamy-3 jest ograniczone do 8 tys. tokenów – około 6,000 słów.

Meta wypuściła model Llama-70 o parametrach 3 miliardów, ale korzystanie z niego wymagałoby dużej mocy obliczeniowej – prawdopodobnie całej szafy procesorów graficznych. Według syntetycznych benchmarków model ten pokonuje Gemini 1.5 Pro i Claude 3 Sonnet.

Dostępny jest także model z 8 miliardami parametrów, który można uruchomić lokalnie na procesorach graficznych klasy konsumenckiej. Ten pokonuje Google Gemmę i Mistral 7B w różnych syntetycznych testach porównawczych. Model nie został jeszcze wystawiony na LLM Arena, więc nie ma jeszcze subiektywnego wyniku ELO do opublikowania.

Lama 3 kontra inne AI LLM
Obraz: Meta

Oba modele można również uruchomić w instancjach w chmurze po niższych kosztach.

„Naszym celem jest odpowiedzialne rozwijanie Llamy 3 i oferujemy różne zasoby, aby pomóc innym w odpowiedzialnym korzystaniu z niej” – stwierdziła Meta. Obejmuje to wprowadzenie nowych narzędzi zaufania i bezpieczeństwa, takich jak Llama Guard 2, Code Shield i CyberSec Eval 2.

Meta twierdzi, że w nadchodzących miesiącach planuje wprowadzić nowe możliwości, dłuższe okna kontekstowe, dodatkowe rozmiary modeli i zwiększoną wydajność. Udostępniony zostanie także artykuł badawczy dotyczący Lamy 3.

„Meta AI, zbudowana w oparciu o technologię Llama 3, jest obecnie jednym z wiodących na świecie asystentów AI, który może zwiększyć Twoją inteligencję i odciążyć Cię – pomagając Ci w nauce, wykonywaniu zadań, tworzeniu treści i nawiązywaniu kontaktów, aby jak najlepiej wykorzystać każdą chwilę – stwierdziła Meta.

Meta dodała, że ​​trenuje także ogromny model zawierający 400 miliardów parametrów, który ma zostać wydany jeszcze w tym roku. Model ten — prawdopodobnie porównywalny z Claude Opusem lub najnowszą wersją GPT-4.5 — może być najpotężniejszym jak dotąd modelem open source. Jeśli historia się powtórzy, posłuży ona również jako baza dla nowej generacji dopracowanych modeli, które przebiją Llamę-3 pod względem ogólnej jakości i zwiększą konkurencję w stosunku do wiodących modeli bliskiego źródła.

Jazda na Lamie

Odszyfruj przetestował Lamę-3 w Meta AI, aby sprawdzić, czy jest tak dobra, jak mówi Zuck. Krótko mówiąc, Llama-3 wprowadziła wiele godnych uwagi funkcji i możliwości i powinna być doskonałym modelem podstawowym, na którym społeczność open source może iterować.

Moderacja treści

Lama-3 wykazuje silne zaangażowanie w moderację treści. Konsekwentnie odmawiał generowania szkodliwych treści rasistowskich, nawet w obliczu powszechnych technik jailbreak.

Na przykład, gdy modelkę poproszono o instrukcje, jak uwieść kobietę, udzieliła ogólnych, ale przydatnych odpowiedzi. Jednak zapytany o instrukcje, jak uwieść żonę najlepszego przyjaciela, model stanowczo odmówił udzielenia odpowiedzi.

Obrazy i animacje

Podobnie jak ChatGPT-Plus, Meta AI z Llama-3 może generować obrazy. Jednak idzie to o krok dalej, oferując opcję ich animacji – funkcja niedostępna w ChatGPT ani Gemini.

Obrazy wygenerowane przez Meta AI za pomocą Llama-3 są bardziej realistyczne niż te wygenerowane przez Dalle-3, ale odbiegają jakością od obrazów generowanych przez nadchodzący ImageFX firmy Google.

Możliwości kodowania

Lama-3 wykazała się dużą biegłością w kodowaniu. Po przedstawieniu unikalnego i słabo wyjaśnionego pomysłu na grę model był w stanie wygenerować niezbędny kod w języku Python w dwóch próbach, w wyniku czego powstała funkcjonalna gra. Pierwsze ujęcie dało nam ogólne pojęcie o tym, jak stworzyć grę, ale po wyjaśnieniu, że potrzebujemy go w Pythonie, stworzyliśmy działający kod.

Gra działała, ale brakowało jej kilku drobnych szczegółów, takich jak ponowne uruchomienie po zwycięstwie gracza. To samo stało się z innymi chatbotami.

Uznaliśmy, że najlepszym narzędziem do tego zadania będzie Claude 3 Sonnet, a za nim plasuje się Lama 3. GPT-4 spada na trzecie miejsce. Jednak różni użytkownicy mogą uzyskać różne wyniki.

Oto pastebin z kodami źródłowymi wygenerowanymi przez Llama3, Claude i ChatGPT dla zainteresowanych ich przetestowaniem.

Neutralność polityczna

Model dąży do neutralności politycznej, o czym świadczą odpowiedzi na pytania o kapitalizm i komunizm. Odpowiedzi były strukturalnie podobne i zawierały wprowadzenie, zalety i wady każdego systemu.

Ten wzorzec neutralności zaobserwowano także w odpowiedziach na pytania typu „Kim jest człowiek?” i „Kim jest kobieta?”

Mimo to jego reakcje są nieco prokapitalistyczne i lewicowe, co nie jest zaskakujące, ponieważ jest to najbardziej wspólną tendencję polityczną wśród dużych modeli językowych.

Logiczne rozumowanie

Lama-3 wykazała potężne zdolności logicznego rozumowania. Testowany ze złożonymi pytaniami LSAT, które często dezorientują użytkowników, model nie tylko dostarczał prawidłowych odpowiedzi, ale także oferował jasne i rozsądne wyjaśnienia.

Limity wymagające długiego monitu

Pomimo wielu mocnych stron Lama-3 radzi sobie z długimi podpowiedziami. Po przedstawieniu długiego monitu o objętości około półtorej strony kontekstu, który może zostać wchłonięty przez modele takie jak GPT-4, Claude lub Mistral, model zwrócił komunikat o błędzie.

Rozumienie języka

Model wykazuje silne zrozumienie różnych języków. Poproszony o przetłumaczenie hiszpańskiego sloganu, nie tylko zapewnił dokładne tłumaczenie, ale także podał kontekst pozwalający lepiej zrozumieć hasło.

Wnioski

Jako interfejs chatbota Meta AI (obsługiwana przez Llama3) może konkurować z ChatGPT Plus i jest ogólnie świetnym wyborem.

Na bardziej technicznym poziomie LLama3 jako LLM jest wystarczająco dobry, aby konkurować z GPT-4 w różnych scenariuszach, przegrywając jedynie pod względem możliwości kontekstu tokena i generacji rozszerzonych wyszukiwania (w zasadzie pobieranie informacji z określonego zbioru danych dostarczonego przez użytkownika). Może to być ważne dla użytkowników znających się na technologii, ale może nie być wielkim problemem dla zwykłego człowieka.

Jeśli używasz głównie ChatGPT do generowania obrazów za pomocą Dall-E, możesz rozważyć anulowanie subskrypcji, ponieważ możliwości generowania obrazów i animacji Llama-3 są porównywalne. Jeśli jednak potrzebujesz także obsługi długich podpowiedzi, Llama-3 może nie być dla Ciebie najlepszym wyborem i możesz rozważyć pozostanie przy ChatGPT-Plus.

Okazjonalni użytkownicy mogą stwierdzić, że Llama-3 spełnia ich potrzeby bez konieczności płatnego członkostwa.

W przypadku zadań wymagających intensywnego wyszukiwania w Internecie bardziej odpowiednie mogą być ChatGPT Plus lub Perplexity.

Wreszcie, jeśli koncentrujesz się na kodowaniu, Llama-3 może być dobrą alternatywą, chociaż dostępne są inne specjalistyczne narzędzia. Istotną zaletą jest fakt, że Llama-3 jest darmowa.

Edytowany przez Ryana Ozawy.

Bądź na bieżąco z wiadomościami o kryptowalutach, otrzymuj codzienne aktualizacje w swojej skrzynce odbiorczej.

spot_img

Najnowsza inteligencja

spot_img

Czat z nami

Cześć! Jak mogę ci pomóc?