هوش داده های تولیدی

مدل ربات چت Grok-1 در طبیعت منتشر شد

تاریخ:

همانطور که قول داده بود، ایلان ماسک مدل پشت ربات چت xAI، Grok-1 را منتشر کرد.

منتشر شد تحت مجوز Apache 2.0، وزن های مدل پایه و معماری شبکه اکنون در دسترس هستند. این مدل دارای 314 میلیارد پارامتر است و برای اجرای آن به سخت افزار با حافظه GPU کافی نیاز دارد. این برای برنامه‌هایی مانند گفتگوی زبان طبیعی به‌خوبی تنظیم شده است و نشان‌دهنده نقطه بازرسی مدل پایه خام از مرحله پیش‌آموزشی است که در اکتبر 2023 به پایان رسید.

منتقدان به عملکرد نسبتا ضعیف در معیارها اشاره کرده اند. در حالی که گروک یک مدل بزرگ است، با آنچه برخی مهندسان دیده اند ضعیف عمل می کند. با در نظر گرفتن میزان ضعیف بودن آن در مقایسه با سایر مدل ها، واقعاً بر اهمیت تنظیم دقیق تأکید می کند. مدل‌هایی با تعداد پارامترهای بسیار کوچک‌تر در بسیاری از معیارها از آن بهتر عمل می‌کنند.» اعلان در تالارهای خبری هکر دیشب.

ممکن است متوجه شوید که هر چه کوچکتر باشد میستال به عنوان مثال، به خوبی Grok-1 عمل می کند.

برای قرار دادن اندازه آن چشم اندازحتی با 314 میلیارد پارامتر، هنوز هم تا حدودی با GPT-4 OpenAI که در آخرین شمارش 1.76 تریلیون پارامتر داشت، ارتباط دارد.

قابل‌توجه، برخلاف LLM‌های موجود، که بر روی داده‌ها با نقطه قطع زمانی آموزش داده می‌شوند، Grok از طریق X.com به مجموعه داده‌های بی‌درنگ Xeets دسترسی دارد، که باید در روزهای آینده آزمایش‌های جالبی را انجام دهد، هرچند به عنوان آزمایشی دیگر. نظردهنده خاطرنشان کرد: "داده های توییت توییتر به خودی خود هم بسیار خاص و هم از نظر طراحی کوتاه هستند، که به تنهایی برای آموزش یک LLM مفید نیست."

گروک برای کاربران پلتفرم رسانه اجتماعی ماسک، X آشنا خواهد بود و مشترکین می‌توانند از چت‌بات سؤال بپرسند و پاسخ‌ها را دریافت کنند. به گفته xAI، گروک با الگوبرداری از The Hitchhiker's Guide to the Galaxy ساخته شده است. "در نظر گرفته شده است که تقریباً به هر چیزی پاسخ دهد و، بسیار سخت تر، حتی پیشنهاد دادن چه سوالاتی را بپرسد."

اگر کاربر یک کپی گوش سگ از را ورق بزند اسکریپت های رادیویی «راهنمای هیچیکر برای کهکشان».، تعریف زیر را می توان در کمین Fit the Tenth یافت: «راهنمای Hitchhiker به کهکشان همراهی ضروری برای همه کسانی است که می خواهند زندگی را در یک جهان بی نهایت پیچیده و گیج کننده معنا کنند، زیرا اگرچه نمی توان امیدوار بود که چنین باشد. در مورد همه موضوعات مفید یا آموزنده است، این ادعای اطمینان بخش را مطرح می کند که در جایی که نادرست است، حداقل به طور قطعی نادرست

"در صورت اختلاف عمده، همیشه واقعیت این است که اشتباه می کند."

این نسخه در اولین سالگرد عرضه مدل GPT-4 OpenAI منتشر می شود و اختلاف حقوقی ماسک با دوستان سابق هوش مصنوعی خود در پس زمینه باقی مانده است. در ابتدای این ماه، ماسک از OpenAI شکایت کرد، با این ادعا که علیرغم نام آن، اطلاعات کمی درباره شرکت وجود دارد. OpenAI در پاسخ با انتشار مجموعه‌ای از ایمیل‌ها، مدعی شد که ماسک از برنامه‌هایش کاملاً آگاه بوده و می‌خواهد آن را در تسلا جمع کند.

پاتریک بکمن، شریک عمومی OpenOcean، در مورد انتشار Grok-1 گفت: «برای یک بار هم که شده، ایلان ماسک اصول خود را عملی می کند. اگر از OpenAI به دلیل تبدیل شدن به یک سازمان سود محور شکایت کنید، باید آماده باشید که به همان آرمان ها پایبند باشید.

چی نه منتشر شده توسط xAI نیز قابل توجه است. وزنه‌های Grok-1 وجود دارد، اما داده‌های مورد استفاده برای آموزش با مجوز مشابه در دسترس نیستند، و همین امر باعث شد که گری مارکوس متخصص هوش مصنوعی فریاد زدن: "PartlyOpenAI."

ابزارهای مولد منبع باز AI بحث برانگیز ثابت شده است. برخی از توسعه دهندگان نگران هستند که در دسترس قرار دادن فناوری باعث سوء استفاده شود و برخی دیگر به مزایای ذاتی شفافیت اشاره می کنند.

متا به اشتراک گذاشته شده - نوعی از - مدل‌های Llama 2 آن در سال گذشته، و شرکت‌های دیگر نیز از آن پیروی کردند. از سوی دیگر، OpenAI قطعاً چنین نیست.

با باز کردن وزنه‌های پشت Grok-1، ماسک در تلاش است پرچمی را در اردوگاه مقابل دنیای اختصاصی OpenAI نصب کند.

در مورد عملکرد نهایی آن، مانند هر چیزی که ماسک لمس می‌کند، می‌تواند در هر دو طرف پیش برود. ®

نقطه_img

جدیدترین اطلاعات

نقطه_img