ربات جدید خود بهبود دهنده DeepMind برای سازگاری و یادگیری مهارت های تازه سریع است

با وجود پیشرفت های سریع در هوش مصنوعی، ربات ها سرسختانه گنگ باقی می مانند. اما تحقیقات جدید DeepMind نشان می‌دهد که همان فناوری در مدل‌های زبان بزرگ (LLM) می‌تواند به ایجاد مغزهای سازگارتر برای بازوهای رباتیک کمک کند.

در حالی که روبات‌های مستقل شروع به حرکت از آزمایشگاه و ورود به دنیای واقعی کرده‌اند، اما شکننده هستند. تغییرات جزئی در محیط یا شرایط نوری می تواند به راحتی هوش مصنوعی را که آنها را کنترل می کند از بین ببرد، و این مدل ها قبل از اینکه بتوانند وظایف مفیدی را انجام دهند باید به طور گسترده بر روی پیکربندی های سخت افزاری خاص آموزش ببینند.

این در تضاد کامل با آخرین LLM ها قرار دارد که نشان داده اند مهارت دارندt تعمیم مهارت های خود به طیف وسیعی از وظایف، اغلب در زمینه های ناآشنا. این باعث علاقه فزاینده ای به دیدن اینکه آیا فناوری زیربنایی - معماری معروف به ترانسفورماتور - می تواند به پیشرفت هایی در رباتیک.

در نتایج جدید، محققان at نمایش DeepMinded که یک هوش مصنوعی مبتنی بر ترانسفورماتور به نام RoboCat نه تنها می‌تواند طیف وسیعی از مهارت‌ها را بیاموزد، بلکه می‌تواند به راحتی بین بدنه‌های روباتیک مختلف جابه‌جا شود و مهارت‌های جدید را بسیار سریع‌تر از حالت عادی دریافت کند. شاید مهم‌تر از همه، این است که می‌تواند با تولید داده‌های آموزشی خود، یادگیری خود را تسریع بخشد.

"توانایی RoboCat برای یادگیری مستقل مهارت‌ها و بهبود سریع خود، به ویژه زمانی که در دستگاه‌های رباتیک مختلف اعمال شود، به هموار کردن راه به سوی نسل جدیدی از عوامل رباتیک مفیدتر و همه منظوره کمک می‌کند.»oشما در یک پست های وبلاگ.

هوش مصنوعی جدید بر اساس مدل Gato است که محققان DeepMind ماه گذشته از آن رونمایی کردند. این قادر به حل طیف گسترده ای از کارها، از شرح تصاویر گرفته تا بازی های ویدیویی و حتی کنترل بازوهای رباتیک است. این امر مستلزم آموزش بر روی یک مجموعه داده متنوع شامل همه چیز از متن گرفته تا تصاویر و داده های کنترل رباتیک بود.

برای روبوCبا این حال، تیم مجموعه داده ای را ایجاد کرد که به طور خاص بر روی چالش های روباتیک متمرکز شده بود. آن‌ها ده‌ها هزار نمایش از چهار بازوی روباتیک مختلف ایجاد کردند که صدها کار مختلف را انجام می‌دهند، مانند چیدن آجرهای رنگی به ترتیب مناسب یا چیدن میوه‌های مناسب از یک سبد.

این نمایش‌ها هم توسط انسان‌هایی که بازوهای رباتیک را از راه دور کار می‌کنند و هم توسط هوش مصنوعی ویژه وظیفه کنترل بازوهای رباتیک شبیه‌سازی شده در یک محیط مجازی انجام شد. سپس از این داده ها برای آموزش یک مدل بزرگ استفاده شد.

یکی از مزایای اصلی معماری مبتنی بر ترانسفورماتور، محققان در الف مقاله منتشر شده در مانند: arXiv, توانایی دریافت داده های بسیار بیشتر از اشکال قبلی هوش مصنوعی است. Iتقریباً به همین ترتیب، آموزش بر روی حجم وسیعی از متن به LLM ها اجازه می دهد تا قابلیت های زبان عمومی را توسعه دهند. Tمحققان می‌گویند که توانسته‌اند یک عامل «عمومی» ایجاد کنند که می‌تواند طیف وسیعی از وظایف روباتیک را با استفاده از انواع پیکربندی‌های سخت‌افزاری مختلف انجام دهد.

علاوه بر این، محققان نشان دادند که این مدل همچنین می‌تواند وظایف جدیدی را با تنظیم دقیق بین 100 تا 1,000 نمایش از یک بازوی رباتیک تحت کنترل انسان انجام دهد. این قابل توجه استy کمتر تظاهرات نسبت به آنچه که معمولاً برای آموزش در یک کار مورد نیاز است، نشان می‌دهد که این مدل به جای شروع از صفر، بر مهارت‌های کنترل رباتیک عمومی‌تر ساخته می‌شود.

"این قابلیت به تسریع تحقیقات رباتیک کمک می کند، زیرا نیاز به آموزش تحت نظارت انسان را کاهش می دهد و گام مهمی در جهت ایجاد یک ربات همه منظوره است.oتو

جالبتر از همه، محققان توانایی روبو را نشان دادندCدر برای بهبود خود آنها چندین مدل spin-off ایجاد کردند که روی وظایف خاص تنظیم شده بودند و سپس از این مدل ها برای تولید تقریباً 10,000 نمایش بیشتر از این کار استفاده کردند. اینها سپس به مجموعه داده موجود اضافه شدند و برای آموزش نسخه جدیدی از RoboCat با عملکرد بهبود یافته استفاده شدند.

هنگامی که اولین نسخه RoboCat 500 نمایش از یک کار نادیده قبلی را نشان داد، توانست در 36 درصد مواقع آن را با موفقیت انجام دهد. اما پس از چندین دوره خودسازی و آموزش در مورد وظایف جدید، این رقم بیش از دو برابر شد و به 74 درصد رسید.

مسلماً، این مدل هنوز در برخی از مشکلات عالی نیست، با میزان موفقیت زیر 50 درصد در چندین کار و کسب تنها 13 درصد در یک کار. اما توانایی RoboCat در تسلط بر بسیاری از چالش‌های مختلف و انتخاب سریع چالش‌های جدید نشان می‌دهد که مغز روبات‌های سازگارتر ممکن است چندان دور از دسترس نباشد.

تصویر های اعتباری: Deepmind

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
PlatoESG. خودرو / خودروهای الکتریکی، کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
BlockOffsets. نوسازی مالکیت افست زیست محیطی. دسترسی به اینجا.
منبع: https://singularityhub.com/2023/06/25/deepminds-new-robot-uses-ai-to-learn-without-supervision/

هوش داده های تولیدی

ربات جدید خود بهبود دهنده DeepMind برای سازگاری و یادگیری مهارت های تازه سریع است.

تضمین آینده بیت کوین: کاوش رونزهای باستانی به عنوان یک استراتژی دفاعی مدرن

ایمن سازی آینده بیت کوین با خرد باستانی: استراتژی رونز که توسط IntoTheBlock کاوش شده است

جدیدترین اطلاعات

ایمن سازی عصر دیجیتال با خرد باستانی: پتانسیل رونز در افزایش امنیت بلند مدت بیت کوین

امنیت دلربا: هنر باستانی رونز و آینده محافظت از بیت کوین

رمزگشایی امنیت: اتحاد غیر متعارف رونز و آینده بیت کوین

ایمن سازی طلای دیجیتال: کاوش در تلفیق رونزهای باستانی و فناوری بلاک چین برای آینده بیت کوین

رمزگذاری رونیک و اوراکلز: کاوش حکمت باستانی برای آینده امنیتی بیت کوین

Ancient Wisdom Meets Modern Tech: Exploring Runes به عنوان یک رویکرد جدید برای امنیت بیت کوین