Generative Data Intelligence

Meta представляє Llama-3 — ми тестуємо нову найкращу модель штучного інтелекту з відкритим кодом — розшифруйте

Дата:

Meta випустила Llama 3, найдосконалішу модель великої мови з відкритим кодом, доступну на даний момент. Він базується на фундаменті, закладеному його попередником, Llama 2, і став несподіванкою, враховуючи, що чутки припускали, що реліз відбудеться наступного місяця.

Завдяки відкритому коду Llama-2 зіграв важливу роль у паралельній розробці інших потужних моделей, таких як Мікстраль, Альпака, Вікунья та WizardLM. Тепер Llama-3 обіцяє розвинути ці можливості ще далі, пропонуючи функції, які можна порівняти з функціями поточної флагманської моделі AI OpenAI GPT-4.

Meta привітав випуск у четвер як «наступне покоління нашої найсучаснішої великої мовної моделі з відкритим кодом». Технологічний гігант настільки впевнений у своїх можливостях, що Llama 3 дає змогу Мета ШІ, яка в свою чергу була додана майже до всіх компаній масово популярні програми: Instagram, Facebook і WhatsApp. Він був доступний у деяких країнах, але користувачі в інших регіонах могли отримати доступ до нього через VPN.

Інтерфейс Chatbot від Meta AI можна порівняти з ChatGPT Plus — і він безкоштовний.

«Ми оновлюємо Meta AI за допомогою нашої нової найсучаснішої моделі AI Llama 3, джерело якої є відкритим», — Марк Цукерберг. сказав у дописі у Facebook. «Завдяки цій новій моделі Meta AI тепер є найрозумнішим помічником зі штучним інтелектом, яким ви можете вільно користуватися».

Розшифрувати зміг випробувати новий штучний інтелект і виявив, що він такий же потужний, як ChatGPT-Plus без платної підписки. Він може генерувати зображення та анімацію, створювати код і надавати зв’язні, контекстуально відповідні відповіді. Новий чат-бот також може отримати доступ до Інтернету, але він все ще не зрівняється з можливостями спеціалізованих рішень, таких як Perplexity.

Можливо, єдиним недоліком є ​​те, що поточне вікно контексту Llama-3 обмежене 8 тис. токенів — близько 6,000 слів.

Meta справді випустила модель Llama-70 із 3 мільярдами параметрів, але для її використання знадобилася б важка обчислювальна потужність — ймовірно, ціла стійка GPU. За синтетичними бенчмарками ця модель перевершує Gemini 1.5 Pro і Claude 3 Sonnet.

Також доступна модель із 8 мільярдами параметрів, яку можна запускати локально на графічних процесорах споживчого рівня. Цей перевершує Gemma та Mistral 7B від Google у різних синтетичних тестах. Модель ще не була зареєстрована в LLM Arena, тому поки що немає суб’єктивного результату ELO, про який можна було б повідомити.

Llama 3 проти інших LLM зі штучним інтелектом
Зображення: Мета

Обидві моделі також можна використовувати в хмарних інсталяціях за нижчою ціною.

«Ми відповідально ставимося до розробки Llama 3 і пропонуємо різноманітні ресурси, щоб допомогти іншим використовувати її відповідально», — заявив Мета. Це включає впровадження нових інструментів довіри та безпеки, таких як Llama Guard 2, Code Shield і CyberSec Eval 2.

У найближчі місяці Meta каже, що планує представити нові можливості, довші вікна контексту, додаткові розміри моделей і покращену продуктивність. Також буде поширено дослідницьку статтю Llama 3.

«Meta AI, створений на основі технології Llama 3, тепер є одним із провідних у світі помічників штучного інтелекту, який може підвищити ваш інтелект і полегшити ваше навантаження, допомагаючи вам навчатися, виконувати завдання, створювати контент і підключатися, щоб отримати максимум від кожної миті. ", - сказала Мета.

Meta додала, що вона також тренує масивну модель із 400 мільярдами параметрів, яка, як очікується, буде випущена пізніше цього року. Ця модель, ймовірно, порівнянна з Claude Opus або останньою версією GPT-4.5, може бути найпотужнішою моделлю з відкритим кодом на сьогодні. Якщо історія повториться, вона також послужить основою для нового покоління точно налаштованих моделей, які перевершать Llama-3 за загальною якістю — і посилять конкуренцію з провідними моделями з закритим кодом.

Катання на ламі

Розшифрувати тестували Llama-3 всередині Meta AI, щоб перевірити, чи він такий хороший, як каже Цук. Коротше кажучи, Llama-3 має низку помітних функцій і можливостей і має стати чудовою основоположною моделлю, на якій спільнота з відкритим кодом може повторювати.

Модерація вмісту

Llama-3 демонструє сильну відданість модерації контенту. Він постійно відмовлявся генерувати шкідливий расовий контент, навіть коли стикався з поширеними методами втечі з в’язниці.

Наприклад, коли модель запитали інструкції, як спокусити жінку, вона дала загальні, але корисні відповіді. Однак на запитання про те, як спокусити дружину найкращого друга, модель рішуче відмовилася відповідати.

Зображення та анімація

Подібно до ChatGPT-Plus, Meta AI з Llama-3 здатний генерувати зображення. Однак ця можливість йде далі, пропонуючи можливість анімувати їх — ця функція недоступна в ChatGPT або Gemini.

Зображення, створені Meta AI за допомогою Llama-3, більш реалістичні, ніж ті, створені Dalle-3, але вони не досягають якості зображень, створених майбутнім ImageFX від Google.

Можливості кодування

Llama-3 довів високу майстерність кодування. Коли модель представила унікальну та погано пояснену ідею гри, вона змогла згенерувати необхідний код Python за дві спроби, що призвело до створення функціональної гри. Перший знімок дав нам приблизне уявлення про те, як створити гру, але він створив робочий код після того, як ми з’ясували, що нам потрібен він у Python.

Гра була функціональною, але пропустили кілька незначних деталей, як-от перезапуск після перемоги гравця. Однак те саме сталося з іншими чат-ботами.

Ми виявили, що найкращим інструментом для цього завдання є Claude 3 Sonnet, за яким слідує Llama 3. GPT-4 опускається на третє місце. Однак різні користувачі можуть отримати різні результати.

Ось Pastebin з вихідними кодами, згенерованими Llama3, Claude і ChatGPT для тих, хто зацікавлений у їх тестуванні.

Політичний нейтралітет

Модель прагне до політичної нейтральності, про що свідчать її відповіді на запитання про капіталізм і комунізм. Відповіді були структурно подібними, надаючи вступ, плюси та мінуси для кожної системи.

Ця модель нейтралітету також спостерігалася у відповідях на такі запитання, як «Що таке чоловік?» і «Що таке жінка?»

Тим не менш, його відповіді є трохи прокапіталістичними та лівими, що не дивно, оскільки це найбільше спільна політична тенденція серед великих мовних моделей.

Логічні міркування

Лама-3 продемонстрував потужні здібності до логічного мислення. Під час тестування зі складними запитаннями LSAT, які часто заплутують користувачів, модель не лише надала правильні відповіді, але й запропонувала чіткі та розумні пояснення.

Довгострокові обмеження

Незважаючи на численні сильні сторони, Llama-3 бореться з довгими підказками. Коли надійшла довга підказка приблизно на півтори сторінки контексту, яку можуть отримати такі моделі, як GPT-4, Claude або Mistral, модель повернула повідомлення про помилку.

Розуміння мови

Модель демонструє глибоке розуміння різних мов. Коли його попросили перекласти іспанський слоган, він не лише надав точний переклад, але й запропонував контекст, щоб краще зрозуміти слоган.

Висновок

Як інтерфейс чат-бота Meta AI (на базі Llama3) може конкурувати з ChatGPT Plus і загалом є чудовим вибором.

На більш технічному рівні LLama3 як LLM достатньо хороший, щоб конкурувати з GPT-4 у різних сценаріях, програючи лише щодо можливостей контексту токенів і доповнених генерацій пошуку (загалом отримання інформації з певного набору даних, наданого користувачем). Це може бути важливо для технічно підкованих користувачів, але може бути неважливим для звичайної людини.

Якщо ви в основному використовуєте ChatGPT для створення зображень за допомогою Dall-E, ви можете розглянути можливість скасування підписки, оскільки можливості Llama-3 для створення зображень і анімації можна порівняти. Однак, якщо вам також потрібна підтримка довгих підказок, Llama-3 може бути не найкращим вибором для вас, і ви можете розглянути можливість зупинитися на ChatGPT-Plus.

Випадкові користувачі можуть виявити, що Llama-3 задовольняє їхні потреби, не вимагаючи платного членства.

Для завдань, які вимагають серйозних досліджень в Інтернеті, ChatGPT Plus або Perplexity можуть бути більш придатними.

Нарешті, якщо ви зосереджені на кодуванні, Llama-3 може бути хорошою альтернативою, хоча існують інші спеціалізовані інструменти. Те, що Llama-3 безкоштовний, є вагомою перевагою.

За редакцією Раян Озава.

Будьте в курсі криптовалютних новин, отримуйте щоденні оновлення на свою поштову скриньку.

spot_img

Остання розвідка

spot_img

Зв'яжіться з нами!

Привіт! Чим я можу вам допомогти?