Kecerdasan Data Generatif

GPT-4 OpenAI tidak akan menjalankan Doom, tetapi akan memainkan game dengan buruk

Tanggal:

Anda mungkin mendapati diri Anda tinggal di gubuk senapan. Dan Anda mungkin mendapati diri Anda bekerja dengan GPT-4. Dan Anda mungkin bertanya pada diri sendiri, โ€œApakah GPT-4 akan menjalankan Doom?โ€ Dan Anda mungkin bertanya pada diri sendiri, โ€œApakah saya benar? Apakah aku salah?"

Adrian de Wynter, ilmuwan terapan utama di Microsoft dan peneliti di Universitas York di Inggris, mengajukan pertanyaan ini dalam makalah penelitian terbarunya, โ€œAkankah GPT-4 Menjalankan Doom?"

Sayangnya, GPT-4, model bahasa besar dari OpenAI yang didukung Microsoft, tidak memiliki kapasitas untuk mengeksekusi kode sumber Doom secara langsung.

Namun varian multimodalnya, GPT-4V, yang dapat menerima gambar sebagai masukan dan juga teks, menunjukkan permainan sub-kompetensi yang sama menawannya. Kiamat sebagai model berbasis teks yang telah meluncurkan banyak startup AI.

โ€œDalam penyiapan makalah ini, GPT-4 (dan GPT-4 dengan vision, atau GPT-4V) tidak dapat benar-benar menjalankan Doom dengan sendirinya, karena dibatasi oleh ukuran inputnya (dan, tentu saja, kemungkinan besar hanya akan mengada-ada). ; Anda benar-benar tidak ingin kompiler Anda berhalusinasi setiap lima menit), โ€tulis de Wynter dalam penjelasannya mencatat tentang makalahnya. โ€œMeskipun demikian, ia pasti dapat bertindak sebagai proxy untuk mesinnya, tidak seperti 'apakah ia akan menjalankan Doom?' implementasi, seperti E. Coli or Notepad. "

Artinya, GPT-4V tidak akan menjalankan Doom seperti traktor John Deere tapi itu akan memainkan Doom tanpa pelatihan khusus.

Untuk mengelola hal ini, de Wynter merancang komponen Vision yang disebut GPT-4V, yang menangkap tangkapan layar dari mesin game dan mengembalikan deskripsi struktur status game. Dan dia menggabungkannya dengan model Agen yang memanggil GPT-4 untuk mengambil keputusan berdasarkan masukan visual dan riwayat sebelumnya. Model Agen telah diminta untuk menerjemahkan responsnya menjadi perintah penekanan tombol yang memiliki arti bagi mesin game.

Interaksi ditangani melalui lapisan Manajer yang terdiri dari pengikatan Python sumber terbuka ke C Mesin malapetaka berjalan di Matplotlib.

Bagan yang menunjukkan desain sistem GPT-4V untuk memainkan DOOM

Diagram De Wynter menunjukkan desain sistem GPT-4V untuk memainkan Doomโ€ฆ Klik untuk memperbesar

Perpaduan model dan kode AI ini dapat membuka pintu, melawan musuh, dan menembakkan senjata, menurut surat kabar tersebut. Dan ia dapat menjalankan serangkaian instruksi yang lebih luas seperti panduan tingkat untuk meningkatkan kinerjanya sendiri.

Kelemahan utama sistem berbasis GPT-4V ini adalah kurangnya kepermanenan objek โ€“ sistem ini melupakan zombie dalam game saat mereka keluar dari layar.

GPT-4 melupakan zombie dan terus berjalan

โ€œMisalnya, sangat umum bagi model untuk melihat zombie di layar, dan mulai menembakinya hingga menabraknya (atau mati),โ€ jelas de Wynter. โ€œSekarang, ini adalah AI yang ditulis untuk bekerja dengan perangkat keras tahun 1993, jadi menurut saya AI ini tidak memiliki pohon keputusan yang sangat mendalam. Jadi zombie itu menembak Anda dan kemudian mulai berlarian di sekitar ruangan.

โ€œApa masalahnya di sini? Pertama-tama, zombie itu tidak terlihat. Lebih buruk lagi, ia masih hidup dan suatu saat akan menghantam Anda. Jadi kamu harus mengejarnya, kan? Lagi pula, di Doom, itu adalah pukulan atau pukulan.

โ€œTernyata GPT-4 melupakan zombie tersebut dan terus berjalan. Catatan: prompt secara eksplisit memberi tahu model apa yang harus dilakukan jika model menerima kerusakan dan tidak dapat melihat musuh. Lebih baik lagi, ia pergi begitu saja, terjebak di sudut, dan mati. Itu memang berputar beberapa kali, tetapi dalam hampir 50-60 putaran, saya mengamatinyaโ€ฆ dua kali, menurut saya.โ€

Selain itu, GPT-4 tidak dapat memberikan alasan yang baik. Ketika diminta menjelaskan tindakannya yang secara umum benar dalam konteksnya, penjelasannya buruk dan sering kali disertai halusinasi (alias informasi yang salah).

De Wynter tetap menganggap luar biasa bahwa GPT-4 mampu memainkan Doom tanpa pelatihan sebelumnya.

Pada saat yang sama, dia merasa hal itu meresahkan.

โ€œDi departemen etika, cukup mengkhawatirkan betapa mudahnya bagi (a) saya membuat kode agar model dapat memotret sesuatu; dan (b) agar model dapat memotret sesuatu secara akurat tanpa harus menebak-nebak instruksinya,โ€ tulisnya dalam postingan ringkasannya.

โ€œJadi, meskipun ini merupakan eksplorasi yang sangat menarik seputar perencanaan dan penalaran, dan dapat diterapkan dalam pengujian video game otomatis, cukup jelas bahwa model ini tidak menyadari apa yang dilakukannya. Saya sangat mendesak semua orang untuk memikirkan dampak penerapan model ini terhadap masyarakat dan potensi penyalahgunaannya.โ€

Dan Anda mungkin berkata pada diri sendiri, โ€œYa Tuhan, apa yang telah kulakukan?โ€ ยฎ

tempat_img

Intelijen Terbaru

tempat_img