Kecerdasan Data Generatif

Selamat datang di mesin: Yoav Goldberg di NLP

Tanggal:

Saya sedang menelepon nenek saya beberapa hari yang lalu ketika dia mengatakan kepada saya, “Saya tidak tahu apa pekerjaanmu, tapi saya baik-baik saja dengan apa pun selama kamu bahagia.”

Di zaman sekarang ini, menjelaskan kepada nenek Anda apa pekerjaan Anda bisa jadi rumit. Ada pekerjaan yang masih memiliki definisi yang cukup sederhana: jika Anda seorang arsitek, Anda mendesain rumah; jika Anda seorang insinyur, Anda membangunnya. Namun ada juga sejumlah peran terkait teknologi yang sulit dipahami oleh seseorang yang tidak tumbuh besar di lingkungan tersebut. Sangat mudah bagi nenek saya untuk memahami bahwa pekerjaan saya melibatkan menulis, tapi dia tidak memahami sisi internet, apalagi bidang bisnis Unbabel.

Ketika saya bertanya Yoav Goldberg, Dosen Senior di Departemen Ilmu Komputer Universitas Bar Ilan, bagaimana dia akan menjelaskan pekerjaannya kepada neneknya, saya mengharapkan dia berjuang untuk menemukan penjelasan yang cukup mudah untuk dipahami oleh orang awam. Namun ia menyatakan secara sederhana bahwa tugasnya adalah “membuat komputer melakukan sesuatu yang semi-cerdas dengan bahasa yang mengisyaratkan adanya pemahaman”.

Tapi apa sebenarnya yang dilakukan Dosen Senior Ilmu Komputer sehari-hari?

Yoav Goldberg telah membagi waktunya antara dua bidang pekerjaan yang berbeda. Yang pertama adalah mencoba memahami bagaimana model pembelajaran mendalam mempelajari berbagai hal dan apa yang bisa atau tidak bisa mereka pelajari, yang baginya merupakan isu penting karena “tidak ada yang benar-benar memahami apa yang sedang terjadi.” Pekerjaan kedua adalah mencari cara untuk membuat komponen atau alat Pemrosesan Bahasa Alami yang akan berguna bagi orang-orang dan perusahaan yang bisnis intinya bukan NLP dan yang tidak ahli di bidangnya, namun masih membutuhkan alat ini untuk, dalam entah bagaimana, proses bahasa.

Meski tertarik dengan penerapan NLP dalam bisnis, ia merasa secara umum ada kesenjangan antara dunia akademis dan industri. Yang pertama cenderung fokus pada identifikasi dan pemecahan masalah baru, sedangkan yang kedua ingin menerapkan hasil tersebut dalam praktik. Dalam beberapa kasus, penelitian akademis dapat dilakukan dan diterapkan pada industri yang berbeda, namun Yoav Goldberg menjelaskan bahwa sangat sedikit dari penelitian tersebut yang dikembangkan menjadi sebuah produk.

Menurut saya, dari sudut pandang akademis, kita tidak cukup fokus pada hal-hal yang sebenarnya perlu difokuskan, seperti nilai atau metrik lain yang mudah untuk dioptimalkan, namun sebenarnya tidak sesuai dengan apa yang sebenarnya Anda inginkan.

Meskipun ini bukan bidang penelitiannya secara langsung, Goldberg yakin terjemahan mesin mungkin merupakan teknologi terbaik yang ada saat ini terkait dengan penyelidikannya di NLP. Ini adalah cara yang paling berhasil dan paling sering kita lihat diterapkan pada bisnis. Alasannya, menurut pendapatnya, adalah mungkin untuk melakukan banyak hal dengan bahasa tanpa memahaminya sepenuhnya. Ini hanyalah masalah mengubah masukan dalam suatu bahasa menjadi keluaran dalam bahasa lain. Anda tidak harus memahami apa yang ada di tengah.

Hal ini memudahkan terjemahan mesin bekerja cukup baik agar berguna. Namun ketika gagal, kita perlu turun tangan untuk memahami alasannya. Dalam sebuah artikel yang ditulisnya pada tahun 2017, Yoav Goldberg mengaku sangat menghormati bahasa, dibandingkan dengan “orang-orang yang belajar secara mendalam yang tampaknya tidak.” Menurutnya, para peneliti di bidang ini mengklaim telah memecahkan masalah bahasa yang jelas-jelas belum mereka selesaikan.

Mereka memberi kesan bahwa mereka tidak terlalu peduli seperti apa datanya. Anda hanya perlu menekan beberapa angka, tanpa benar-benar menghargai seluk-beluk bahasanya.

Salah satu kehalusan ini adalah konteks. Misalnya, jika Anda membaca di surat kabar sesuatu seperti “kalau harga naik, maka sesuatu akan terjadi”, maka bukan harga secara umum yang akan naik, melainkan harga sesuatu yang mungkin dinyatakan dalam judul atau di bagian lain. teks. Dalam kalimat khusus ini memang tidak jelas, namun setiap orang yang membacanya pasti paham apa maksudnya. Mesin tidak.

Yoav Goldberg saat ini memimpin penelitian untuk memecahkan masalah ini. Ini sangat menantang karena ada banyak cara orang menghilangkan informasi saat berbicara atau menulis. Contoh lainnya adalah mengatakan, “Tidak, terima kasih, saya sudah punya lima.” Itu adalah lima dari sesuatu yang pernah dimiliki pembicara sebelumnya, tetapi kata bendanya hilang setelah nomor tersebut. Cara peneliti menangani hal ini adalah dengan mengisolasi konteks yang berbeda dan mengerjakan masing-masing konteks secara terpisah. Tim Goldberg telah mengembangkan sistem yang sudah dapat menyimpulkan konteks seperti ini dengan relatif baik, namun masih banyak konteks lain yang perlu dipertimbangkan dan dikerjakan.

Ketika merenungkan masa depan penyelidikan dan penerapan NLP, Yoav Goldberg mengatakan kita mungkin masih menggunakan jaringan saraf lima atau bahkan sepuluh tahun dari sekarang. Mereka bekerja dengan baik dan tidak ada teknologi yang lebih baik yang tersedia saat ini. Namun ada satu masalah yang sering terjadi tentang jaringan saraf: jaringan tersebut berfungsi saat Anda memiliki cukup data dan tidak berfungsi saat Anda tidak memiliki cukup data.

Untuk domain yang datanya tidak mencukupi, kami berada pada titik di mana yang terpenting adalah membuat domain tersebut berfungsi dengan lebih sedikit data dan sedikit contoh, namun tetap mencoba menggeneralisasikannya agar sistem bekerja dengan baik. Ini adalah tren yang kemungkinan akan terus diikuti oleh para peneliti di tahun-tahun mendatang.

Mengenai penerjemahan mesin, Yoav Goldberg berpendapat bahwa manusia tidak akan pernah benar-benar tersingkirkan, terutama karena sistem saraf belum mengetahui apakah mereka melakukan kesalahan. Mereka hanya tidak mengerti bahasa seperti manusia.

Namun Yoav Goldberg juga tidak tertarik untuk membuat mereka mengerti.

Saya tidak terdorong oleh pencarian kecerdasan, melainkan oleh pertanyaan-pertanyaan seperti, “Bagaimana bahasa terstruktur dan bagaimana kita dapat melakukan hal-hal berguna dengannya?”

Ini adalah pertanyaan-pertanyaan yang telah membimbingnya sepanjang 20 tahun karirnya - pertanyaan-pertanyaan yang tidak ia duga muncul ketika ia masih kecil yang ingin tumbuh menjadi penyihir atau pahlawan super. Dia memainkan banyak video game dan selalu penasaran bagaimana Anda mengetikkan perintah untuk mewujudkan sesuatu. Dia juga mengatakan dia selalu peduli dengan bahasa sampai batas tertentu.

Mungkin penyihir, pahlawan super, atau bahkan bintang reality TV (beberapa tahun yang lalu dia berkesempatan untuk berpartisipasi dalam Beauty and the Geek versi Israel, namun menolak undangan tersebut), akan lebih mudah untuk dijelaskan kepada kerabat yang lebih tua, tetapi Dosen Senior di bidang Ilmu Komputer entah bagaimana lebih masuk akal.

Sumber: https://unbabel.com/blog/yoav-goldberg-natural-bahasa-processing/

tempat_img

Intelijen Terbaru

tempat_img