با وجود پیشرفت های سریع در هوش مصنوعی، ربات ها سرسختانه گنگ باقی می مانند. اما تحقیقات جدید DeepMind نشان میدهد که همان فناوری در مدلهای زبان بزرگ (LLM) میتواند به ایجاد مغزهای سازگارتر برای بازوهای رباتیک کمک کند.
در حالی که روباتهای مستقل شروع به حرکت از آزمایشگاه و ورود به دنیای واقعی کردهاند، اما شکننده هستند. تغییرات جزئی در محیط یا شرایط نوری می تواند به راحتی هوش مصنوعی را که آنها را کنترل می کند از بین ببرد، و این مدل ها قبل از اینکه بتوانند وظایف مفیدی را انجام دهند باید به طور گسترده بر روی پیکربندی های سخت افزاری خاص آموزش ببینند.
این در تضاد کامل با آخرین LLM ها قرار دارد که نشان داده اند مهارت دارندt تعمیم مهارت های خود به طیف وسیعی از وظایف، اغلب در زمینه های ناآشنا. این باعث علاقه فزاینده ای به دیدن اینکه آیا فناوری زیربنایی - معماری معروف به ترانسفورماتور - می تواند به پیشرفت هایی در رباتیک.
در نتایج جدید، محققان at نمایش DeepMinded که یک هوش مصنوعی مبتنی بر ترانسفورماتور به نام RoboCat نه تنها میتواند طیف وسیعی از مهارتها را بیاموزد، بلکه میتواند به راحتی بین بدنههای روباتیک مختلف جابهجا شود و مهارتهای جدید را بسیار سریعتر از حالت عادی دریافت کند. شاید مهمتر از همه، این است که میتواند با تولید دادههای آموزشی خود، یادگیری خود را تسریع بخشد.
"توانایی RoboCat برای یادگیری مستقل مهارتها و بهبود سریع خود، به ویژه زمانی که در دستگاههای رباتیک مختلف اعمال شود، به هموار کردن راه به سوی نسل جدیدی از عوامل رباتیک مفیدتر و همه منظوره کمک میکند.»oشما در یک پست های وبلاگ.
هوش مصنوعی جدید بر اساس مدل Gato است که محققان DeepMind ماه گذشته از آن رونمایی کردند. این قادر به حل طیف گسترده ای از کارها، از شرح تصاویر گرفته تا بازی های ویدیویی و حتی کنترل بازوهای رباتیک است. این امر مستلزم آموزش بر روی یک مجموعه داده متنوع شامل همه چیز از متن گرفته تا تصاویر و داده های کنترل رباتیک بود.
برای روبوCبا این حال، تیم مجموعه داده ای را ایجاد کرد که به طور خاص بر روی چالش های روباتیک متمرکز شده بود. آنها دهها هزار نمایش از چهار بازوی روباتیک مختلف ایجاد کردند که صدها کار مختلف را انجام میدهند، مانند چیدن آجرهای رنگی به ترتیب مناسب یا چیدن میوههای مناسب از یک سبد.
این نمایشها هم توسط انسانهایی که بازوهای رباتیک را از راه دور کار میکنند و هم توسط هوش مصنوعی ویژه وظیفه کنترل بازوهای رباتیک شبیهسازی شده در یک محیط مجازی انجام شد. سپس از این داده ها برای آموزش یک مدل بزرگ استفاده شد.
یکی از مزایای اصلی معماری مبتنی بر ترانسفورماتور، محققان در الف مقاله منتشر شده در مانند: arXiv, توانایی دریافت داده های بسیار بیشتر از اشکال قبلی هوش مصنوعی است. Iتقریباً به همین ترتیب، آموزش بر روی حجم وسیعی از متن به LLM ها اجازه می دهد تا قابلیت های زبان عمومی را توسعه دهند. Tمحققان میگویند که توانستهاند یک عامل «عمومی» ایجاد کنند که میتواند طیف وسیعی از وظایف روباتیک را با استفاده از انواع پیکربندیهای سختافزاری مختلف انجام دهد.
علاوه بر این، محققان نشان دادند که این مدل همچنین میتواند وظایف جدیدی را با تنظیم دقیق بین 100 تا 1,000 نمایش از یک بازوی رباتیک تحت کنترل انسان انجام دهد. این قابل توجه استy کمتر تظاهرات نسبت به آنچه که معمولاً برای آموزش در یک کار مورد نیاز است، نشان میدهد که این مدل به جای شروع از صفر، بر مهارتهای کنترل رباتیک عمومیتر ساخته میشود.
"این قابلیت به تسریع تحقیقات رباتیک کمک می کند، زیرا نیاز به آموزش تحت نظارت انسان را کاهش می دهد و گام مهمی در جهت ایجاد یک ربات همه منظوره است.oتو
جالبتر از همه، محققان توانایی روبو را نشان دادندCدر برای بهبود خود آنها چندین مدل spin-off ایجاد کردند که روی وظایف خاص تنظیم شده بودند و سپس از این مدل ها برای تولید تقریباً 10,000 نمایش بیشتر از این کار استفاده کردند. اینها سپس به مجموعه داده موجود اضافه شدند و برای آموزش نسخه جدیدی از RoboCat با عملکرد بهبود یافته استفاده شدند.
هنگامی که اولین نسخه RoboCat 500 نمایش از یک کار نادیده قبلی را نشان داد، توانست در 36 درصد مواقع آن را با موفقیت انجام دهد. اما پس از چندین دوره خودسازی و آموزش در مورد وظایف جدید، این رقم بیش از دو برابر شد و به 74 درصد رسید.
مسلماً، این مدل هنوز در برخی از مشکلات عالی نیست، با میزان موفقیت زیر 50 درصد در چندین کار و کسب تنها 13 درصد در یک کار. اما توانایی RoboCat در تسلط بر بسیاری از چالشهای مختلف و انتخاب سریع چالشهای جدید نشان میدهد که مغز روباتهای سازگارتر ممکن است چندان دور از دسترس نباشد.
تصویر های اعتباری: Deepmind
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. خودرو / خودروهای الکتریکی، کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- BlockOffsets. نوسازی مالکیت افست زیست محیطی. دسترسی به اینجا.
- منبع: https://singularityhub.com/2023/06/25/deepminds-new-robot-uses-ai-to-learn-without-supervision/