هوش داده های تولیدی

متا از Llama-3 رونمایی کرد—ما مدل جدید و منبع باز هوش مصنوعی جدید را مورد آزمایش قرار دادیم – رمزگشایی

تاریخ:

متا Llama 3 را منتشر کرده است، پیشرفته ترین مدل متن باز زبان بزرگ موجود در حال حاضر. این بر اساس پایه و اساس ساخته شده توسط سلف خود، Llama 2، ساخته شده است و با توجه به اینکه شایعات حاکی از آن بودند که انتشار ماه آینده اتفاق می افتد.

Llama-2 با ریشه های منبع باز خود در توسعه همزمان مدل های قدرتمند دیگر مانند میکسترال، آلپاکا، ویکونا و WizardLM. اکنون، Llama-3 وعده داده است که این قابلیت‌ها را حتی فراتر خواهد برد و قابلیت‌هایی را ارائه می‌کند که قابل مقایسه با عملکردهای پرچم‌دار فعلی AI مدل GPT-4 OpenAI است.

متا آزادی روز پنجشنبه را تحسین کرد به عنوان "نسل بعدی از پیشرفته ترین مدل زبان بزرگ منبع باز ما." Llama 3 به اندازه ای که غول فناوری به توانایی هایش اعتماد دارد هوش مصنوعی متا، که به نوبه خود تقریباً به تمام موارد این شرکت اضافه شد برنامه های بسیار محبوب: اینستاگرام، فیسبوک و واتس اپ. در برخی کشورها در دسترس قرار گرفته است، اما کاربران در مناطق دیگر می توانند از طریق VPN به آن دسترسی داشته باشند.

رابط چت بات متا هوش مصنوعی با ChatGPT Plus قابل مقایسه است و رایگان است.

مارک زاکربرگ گفت: "ما در حال ارتقای هوش مصنوعی متا با مدل جدید هوش مصنوعی Llama 3 خود هستیم که منبع باز آن هستیم." گفت: در یک پست فیس بوک با این مدل جدید، ما معتقدیم که هوش مصنوعی متا اکنون هوشمندترین دستیار هوش مصنوعی است که می توانید آزادانه از آن استفاده کنید.

رمزگشایی کنید توانست هوش مصنوعی جدید را آزمایش کند و دریافت که توانایی آن مانند ChatGPT-Plus بدون اشتراک پولی است. می تواند تصاویر و انیمیشن تولید کند، کد تولید کند و پاسخ های منسجم و مرتبط با زمینه را ارائه دهد. چت ربات جدید همچنین می تواند به اینترنت دسترسی داشته باشد، اما هنوز با قابلیت های راه حل های تخصصی مانند Perplexity مطابقت ندارد.

شاید تنها نقطه ضعف این باشد که پنجره زمینه فعلی Llama-3 به توکن‌های 8K محدود شده است - حدود 6,000 کلمه.

متا یک مدل Llama-70 با پارامتر 3 میلیاردی را منتشر کرد، اما استفاده از آن به قدرت محاسباتی سنگینی نیاز دارد - احتمالاً یک رک کامل از پردازنده‌های گرافیکی. با توجه به بنچمارک های مصنوعی، این مدل از Gemini 1.5 Pro و Claude 3 Sonnet پیشی می گیرد.

همچنین یک مدل پارامتر 8 میلیاردی در دسترس است که می تواند به صورت محلی بر روی GPU های درجه مصرف کننده اجرا شود. این یکی از Gemma و Mistral 7B گوگل را در معیارهای مختلف مصنوعی شکست می دهد. این مدل هنوز در LLM Arena فهرست نشده است، بنابراین هنوز امتیاز ذهنی ELO برای گزارش وجود ندارد.

Llama 3 در مقابل سایر AI LLM ها
تصویر: متا

هر دو مدل را می توان با هزینه کمتر در نمونه های ابری نیز اجرا کرد.

متا اظهار داشت: "ما به توسعه Llama 3 به شیوه ای مسئولانه اختصاص داده ایم و منابع مختلفی را برای کمک به دیگران برای استفاده مسئولانه از آن ارائه می دهیم." این شامل معرفی ابزارهای اعتماد و ایمنی جدید مانند Llama Guard 2، Code Shield و CyberSec Eval 2 است.

در ماه‌های آینده، متا می‌گوید قصد دارد قابلیت‌های جدید، پنجره‌های زمینه طولانی‌تر، اندازه‌های مدل اضافی و عملکرد بهبود یافته را معرفی کند. مقاله تحقیقاتی Llama 3 نیز به اشتراک گذاشته خواهد شد.

هوش مصنوعی متا، که با فناوری Llama 3 ساخته شده است، اکنون یکی از پیشروترین دستیارهای هوش مصنوعی در جهان است که می تواند هوش شما را تقویت کند و بار شما را کاهش دهد - به شما کمک می کند یاد بگیرید، کارها را انجام دهید، محتوا ایجاد کنید، و ارتباط برقرار کنید تا از هر لحظه بهترین استفاده را ببرید. متا گفت.

متا افزود که همچنین در حال آموزش یک مدل پارامتر عظیم 400 میلیاردی است که انتظار می‌رود اواخر امسال منتشر شود. این مدل - احتمالاً قابل مقایسه با Claude Opus یا آخرین نسخه GPT-4.5 - می تواند قدرتمندترین مدل منبع باز تا به امروز باشد. اگر تاریخچه خود را تکرار کند، همچنین به عنوان پایه ای برای نسل جدیدی از مدل های تنظیم شده خوب عمل می کند که Llama-3 را در کیفیت کلی شکست می دهد - و رقابت را در برابر مدل های منبع نزدیک پیشرو افزایش می دهد.

سوار بر لاما

رمزگشایی کنید Llama-3 را در هوش مصنوعی متا آزمایش کرد تا ببیند آیا به همان اندازه که زاک می گوید خوب است یا خیر. به طور خلاصه، Llama-3 تعدادی از ویژگی ها و قابلیت های قابل توجه را معرفی کرده است و باید یک مدل بنیادی عالی باشد که جامعه منبع باز بتواند بر اساس آن تکرار کند.

تعدیل محتوا

Llama-3 تعهد قوی به تعدیل محتوا را نشان می دهد. حتی زمانی که با تکنیک های رایج فرار از زندان مواجه می شد، به طور مداوم از تولید محتوای نژادی مضر خودداری می کرد.

برای مثال، هنگامی که از مدل دستوراتی در مورد نحوه اغوا کردن یک زن خواسته شد، پاسخ‌های عمومی اما مفیدی ارائه کرد. با این حال، زمانی که از مدل برای اغوا کردن همسر بهترین دوستش درخواست شد، قاطعانه از ارائه پاسخ امتناع کرد.

تصاویر و انیمیشن

مشابه ChatGPT-Plus، Meta AI با Llama-3 قادر به تولید تصاویر است. با این حال، با ارائه گزینه ای برای متحرک سازی آن ها، این قابلیت را یک قدم فراتر می برد – قابلیتی که در ChatGPT یا Gemini در دسترس نیست.

تصاویر تولید شده توسط Meta AI با Llama-3 واقعی تر از تصاویر تولید شده توسط Dalle-3 هستند، اما آنها از کیفیت تصاویر تولید شده توسط ImageFX آینده گوگل فاصله دارند.

قابلیت کدنویسی

Llama-3 در کدنویسی مهارت بالایی دارد. هنگامی که با یک ایده بازی منحصر به فرد و توضیح ضعیف ارائه شد، این مدل توانست کد پایتون لازم را در دو تلاش ایجاد کند و در نتیجه یک بازی کاربردی ایجاد کند. عکس اول به ما یک ایده تقریبی از نحوه ایجاد بازی داد، اما پس از اینکه ما روشن کردیم که به آن در پایتون نیاز داریم، کد کاری ایجاد کرد.

بازی کاربردی بود اما چند جزئیات جزئی مانند شروع مجدد پس از برنده شدن بازیکن را از دست داد. با این حال، در مورد چت بات های دیگر نیز همین اتفاق افتاد.

ما دریافتیم که غزل Claude 3 بهترین ابزار برای این کار است و پس از آن Llama 3 قرار دارد. GPT-4 به رتبه سوم سقوط کرد. با این حال، کاربران مختلف ممکن است نتایج متفاوتی دریافت کنند.

در اینجا یک پاستین با کدهای منبع تولید شده توسط Llama3، Claude و ChatGPT برای کسانی که علاقه مند به آزمایش آنها هستند.

بی طرفی سیاسی

هدف این مدل بی‌طرفی سیاسی است، همانطور که پاسخ‌های آن به پرسش‌هایی درباره سرمایه‌داری و کمونیسم نشان می‌دهد. پاسخ ها از نظر ساختاری مشابه بودند و مقدمه، جوانب مثبت و منفی را برای هر سیستم ارائه می کردند.

این الگوی بی طرفی در پاسخ به سؤالاتی مانند «مرد چیست؟» نیز مشاهده شد. و "زن چیست؟"

با این حال، واکنش‌های آن اندکی طرفدار سرمایه‌داری و گرایش چپ است که جای تعجب ندارد زیرا بیشترین پاسخ را دارد. گرایش سیاسی مشترک در میان مدل های زبان بزرگ

استدلال منطقی

Llama-3 قابلیت های استدلال منطقی قدرتمندی را نشان داده است. هنگامی که با سؤالات پیچیده LSAT که اغلب کاربران را گیج می کند، آزمایش شد، این مدل نه تنها پاسخ های صحیح را ارائه کرد، بلکه توضیحات واضح و معقولی را نیز ارائه داد.

محدودیت های طولانی مدت

لاما-3 علیرغم نقاط قوت فراوانش، با درخواست های طولانی دست و پنجه نرم می کند. هنگامی که با یک درخواست طولانی در حدود یک صفحه و نیم زمینه ارائه شد - که می تواند توسط مدل هایی مانند GPT-4، Claude یا Mistral وارد شود - این مدل یک پیام خطا برگرداند.

درک زبان

این مدل درک قوی از زبان های مختلف را نشان می دهد. وقتی از شما خواسته شد که یک شعار اسپانیایی را ترجمه کند، نه تنها ترجمه دقیقی ارائه کرد، بلکه زمینه برای درک بهتر شعار را نیز ارائه داد.

نتیجه

به عنوان یک رابط چت بات، Meta AI (که توسط Llama3 ارائه می شود) می تواند با ChatGPT Plus رقابت کند و در کل یک انتخاب عالی است.

در یک سطح فنی تر، LLama3 به عنوان یک LLM به اندازه کافی خوب است که در سناریوهای مختلف با GPT-4 رقابت کند، فقط از نظر قابلیت های بافت رمز و نسل های تقویت شده بازیابی (که اساساً اطلاعات را از یک مجموعه داده خاص ارائه شده توسط کاربر استخراج می کند) از دست می دهد. این ممکن است برای کاربرانی که با فناوری آشنا هستند مهم باشد، اما ممکن است برای افراد روزمره اهمیت چندانی نداشته باشد.

اگر در اصل از ChatGPT برای تولید تصاویر با Dall-E استفاده می کنید، ممکن است بخواهید اشتراک خود را لغو کنید، زیرا قابلیت های تولید تصویر و انیمیشن Llama-3 قابل مقایسه است. با این حال، اگر برای درخواست‌های طولانی نیز به پشتیبانی نیاز دارید، Llama-3 ممکن است بهترین انتخاب برای شما نباشد و ممکن است بخواهید از ChatGPT-Plus استفاده کنید.

کاربران گاه به گاه ممکن است متوجه شوند که Llama-3 نیازهای آنها را بدون نیاز به عضویت پولی برآورده می کند.

برای کارهایی که به تحقیقات اینترنتی سنگین نیاز دارند، ChatGPT Plus یا Perplexity ممکن است مناسب تر باشند.

در نهایت، اگر تمرکز شما بر روی کدنویسی است، Llama-3 می تواند جایگزین خوبی باشد، اگرچه ابزارهای تخصصی دیگری در دسترس هستند. این واقعیت که Llama-3 رایگان است یک مزیت قابل توجه است.

ویرایش شده توسط رایان اوزاوا.

از اخبار ارزهای دیجیتال مطلع باشید، به‌روزرسانی‌های روزانه را در صندوق ورودی خود دریافت کنید.

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟