Kecerdasan Data Generatif

Rekap Janji dan Jebakan – Bagian Keempat »Blog CCC

Tanggal:

CCC mendukung tiga sesi ilmiah pada Konferensi Tahunan AAAS tahun ini. Minggu ini, kami akan merangkum hal-hal penting dari sesi ini, “AI Generatif dalam Sains: Janji dan Kesalahan.” Panel ini, dimoderatori oleh Dr.Matthew Turki, presiden Institut Teknologi Toyota di Chicago), ditampilkan Dr.Rebecca Willett, profesor statistik dan ilmu komputer di Universitas Chicago, Dr Markus Buehler, profesor teknik di Institut Teknologi Massachusetts, dan Dr Duncan Watson-Parris, asisten profesor di Scripps Institution of Oceanography dan Halıcıoğlu Data Science Institute di UC San Diego. Di Bagian Empat, kami merangkum bagian Tanya Jawab panel. 

Sesi tanya jawab dilanjutkan dengan presentasi panelis, dan Dr. Matthew Turk memulai diskusi. “'Janji dan Jebakan' ada di judul panel ini. Kita telah membahas banyak janji-janji tersebut, namun kita belum mengatasi banyak kendalanya. Apa yang membuat Anda khawatir tentang masa depan AI generatif?”

“Keandalan dan kepercayaan model-model ini merupakan perhatian besar”, Dr. Rebecca Wilett memulai. “Model-model ini dapat memprediksi hal-hal yang masuk akal, namun tidak memiliki elemen kunci dan penting; Bisakah saya, sebagai manusia, menyadari bahwa ada sesuatu yang hilang di sana?”

Markus Buehler menambahkan bahwa prediksi sebenarnya suatu model mungkin memerlukan waktu beberapa detik, namun proses validasi eksperimental dapat memakan waktu berbulan-bulan atau satu tahun, atau lebih lama lagi. Jadi bagaimana kita harus beroperasi untuk sementara waktu ketika kita belum memverifikasi hasilnya? “Kita juga perlu mendidik pengembang AI generatif generasi berikutnya sehingga mereka merancang model yang dapat dipercaya dan dapat diverifikasi, dan kita dapat menggunakan wawasan berbasis fisika dalam pembuatan model ini.”

Dr. Duncan Watson-Parris mengembangkan kedua poin sebelumnya, dengan mengatakan, “Karena model ini dirancang untuk memberikan hasil yang masuk akal, kita tidak bisa hanya melihat hasil untuk memverifikasi keakuratannya. Peneliti AI generatif perlu memiliki pemahaman mendalam tentang cara kerja model ini untuk memverifikasi hasilnya, itulah sebabnya mendidik generasi berikutnya dengan benar sangatlah penting.”

Audiens: “Dalam ilmu material, kita mengetahui arah ke depan untuk mempelajari beberapa material, namun untuk material lain, seperti superkonduktor suhu ruangan, kita tidak tahu bagaimana untuk bergerak maju. Menurut Anda seperti apa langkah ke depan dalam mempelajari materi yang belum diketahui ini? Dan bagaimana penelitian semacam ini bisa dilakukan dari sudut pandang regulasi?”

“Yah, saya bukan ahli dalam penelitian superkonduktor,” kata Dr. Buehler, “jadi saya tidak akan membahasnya secara langsung, namun saya dapat berbicara secara umum tentang bagaimana kita membuat kemajuan dalam ilmu material, khususnya di bidang protein saya. dan pengembangan biomaterial. Cara kita mencapai kemajuan adalah dengan memiliki kemampuan untuk melampaui batas. Kami menjalankan eksperimen baru dan menguji ide dan teori aneh serta melihat mana yang berhasil dan alasannya. Mengenai bagaimana kita harus mengaktifkan penelitian ini, kita memerlukan lebih banyak model sumber terbuka dengan akses kolektif. Saya akan mendorong para politisi untuk tidak mengatur teknologi ini secara berlebihan, sehingga peneliti dan masyarakat memiliki akses terhadap model-model semacam ini. Menurut saya, mencegah orang menggunakan model ini bukanlah ide yang baik, terutama ketika kita dapat melakukan crowdsourcing ide dan pengembangan serta memperkenalkan pengetahuan dari berbagai bidang aktivitas manusia. Misalnya, ketika mesin cetak ditemukan, pihak berwenang mencoba membatasi ketersediaan teknologi ini sehingga hanya sedikit buku yang dapat dibaca secara massal, namun upaya ini gagal total. Cara terbaik untuk melindungi masyarakat adalah dengan memfasilitasi akses terhadap model-model ini sedemikian rupa sehingga kita dapat mengembangkan, mengeksplorasi, dan mengevaluasinya secara luas untuk memberikan manfaat maksimal bagi masyarakat.”

Anggota Audiens: “Sebagian besar model AI generatif saat ini adalah model regresi yang berfokus pada simulasi atau simulasi berbagai skenario. Namun, penemuan dalam sains didorong oleh hipotesis dan prediksi yang kita impikan. Jadi bagaimana kita membuat model yang dimaksudkan untuk menghasilkan prediksi baru, bukan model saat ini yang sebagian besar digunakan untuk eksperimen?”

Dr. Buehler merespons terlebih dahulu dengan mengatakan, “Anda benar, sebagian besar model pembelajaran mesin tradisional sering kali berbasis regresi, namun model yang kita bicarakan hari ini bekerja secara berbeda. Saat Anda menyusun sistem multi-agen dengan banyak kemampuan, mereka sebenarnya mulai mengeksplorasi skenario baru dan mulai berpikir serta membuat prediksi berdasarkan eksperimen yang mereka jalankan. Mereka menjadi lebih manusiawi. Anda, sebagai peneliti, tidak akan menjalankan eksperimen dan selesai begitu saja – Anda akan menjalankan eksperimen lalu mulai melihat data dan memvalidasinya serta membuat prediksi baru berdasarkan data ini, untuk menghubungkan titik-titik dan melakukan ekstrapolasi dengan membuat hipotesis dan membayangkan bagaimana skenario baru akan terungkap. Anda akan bereksperimen, mengumpulkan data baru, mengembangkan teori, dan mungkin mengusulkan kerangka kerja terpadu tentang suatu hal yang menarik minat Anda. Kemudian Anda akan mempertahankan ide-ide Anda terhadap kritik rekan-rekan Anda dan mungkin merevisi hipotesis Anda ketika informasi baru digunakan. Beginilah cara kerja sistem permusuhan multi-agen yang baru, namun tentu saja sistem ini melengkapi keterampilan manusia dengan kemampuan yang jauh lebih besar untuk mempertimbangkan sejumlah besar data dan representasi pengetahuan. Model-model ini sudah dapat menghasilkan hipotesis-hipotesis baru yang melampaui apa yang telah dipelajari, sehingga menambah proses penemuan dan inovasi ilmiah.”

“Saya akan melengkapi hal tersebut,” sela Dr. Willett, “dengan bidang penemuan penyelesaian dan regresi simbolik sebagai bidang lain yang lebih ditargetkan pada pembuatan hipotesis. Ada banyak pekerjaan yang sedang berlangsung di bidang ini.”

Audiens: “Bagaimana kami meningkatkan akses terhadap model-model seperti ini dan mengatasi kendala, misalnya sebagian besar model dibuat untuk penutur bahasa Inggris?”

Rebecca Willett menjawab, “Banyak orang memiliki akses untuk menggunakan model ini, namun merancang dan melatih model tersebut memerlukan biaya jutaan dolar. Jika hanya sekelompok kecil organisasi yang mampu membuat model-model ini, maka hanya segelintir orang yang mengambil keputusan dan menetapkan prioritas dalam komunitas ilmiah. Seringkali prioritas organisasi-organisasi dan individu-individu ini didorong oleh keuntungan. Meski begitu, menurut saya lanskapnya mulai berubah. Organisasi seperti NSF sedang mencoba membangun infrastruktur yang dapat diakses oleh komunitas ilmiah yang lebih luas. Upaya ini menyerupai pengembangan awal superkomputer. Pada awalnya, para peneliti harus mengajukan proposal panjang untuk mendapatkan akses ke superkomputer. Saya pikir kita akan melihat munculnya paradigma serupa dalam AI dan AI generatif.”

“Saya setuju,” kata Dr. Watson-Parris. “Selain itu dari sisi peraturan, saya pikir kita tidak harus mengatur penelitian dasar, mungkin ruang penerapannya, tapi bukan penelitian itu sendiri.”

Terima kasih banyak telah membaca, dan nantikan rekap dua panel kami lainnya di AAAS 2024.

tempat_img

Intelijen Terbaru

tempat_img