Kecerdasan Data Generatif

Menjadi serius tentang humor: Dapatkah AI memahami lelucon?

Tanggal:

“Aku suka kopiku seperti aku suka perang. Dingin."

Beberapa tahun setelah sepasang ilmuwan di University of Washington menulis sebuah program yang dengan benar menambahkan "itulah yang dia katakan" di akhir kalimat 72% dari waktu, para peneliti di University of Edinburgh memutuskan untuk mencobanya . Mereka melatih model pada sejumlah besar data bahasa untuk membuat lelucon mengikuti struktur "Saya suka X saya suka saya suka Y, Z", menghasilkan lelucon seperti yang di atas, atau yang jauh lebih lucu "Saya suka wanita saya suka saya suka kamera saya ... siap untuk di-flash. "

Tentu, itu tampak seperti lelucon, dan terdengar seperti lelucon, tetapi banyak yang berpendapat bahwa itu tidak memiliki bagian mendasar ketika datang ke komedi - itu tidak lucu.

Ternyata meskipun komputer jauh lebih baik daripada kita di banyak tugas, mereka hanya tidak hebat dalam memecahkan lelucon. Tapi itu tidak menghentikan para peneliti membangun algoritma penghasil komedi. Dan terlepas dari betapa menyenangkannya untuk menyaksikan perjuangan mesin untuk menghasilkan lelucon yang layak, alasan mengapa begitu banyak akademisi dan ilmuwan menjelajahi dunia humor komputasi yang menarik bukanlah murni aneh.

Pengembang, ilmuwan, manajer produk, dan akademisi semuanya bekerja untuk membuat interaksi mesin manusia sebagai alami dan pribadi sebagai percakapan antara dua teman, dan untuk itu, mereka perlu menangani Pemrosesan Bahasa Alami, mengajar komputer untuk memproses, menganalisis, dan mereplikasi struktur bahasa kita. Dan itu bukan tugas yang mudah. Faktanya, seperti yang ditunjukkan oleh manual Linguistik Matematika, “tugas-tugas ini sangat sulit sehingga Turing dapat membuat percakapan yang lancar dalam bahasa alami menjadi pusat ujian kecerdasannya.”

Meskipun Anda tidak perlu mengatakannya setelah serangkaian "video rumah terlucu" di Youtube, humor adalah salah satu bentuk kecerdasan manusia yang paling canggih - secara sosiologis dan semua. Itu sebagian karena bahasa humor biasanya menggunakan ekspresi yang kompleks, ambigu dan tidak sesuai yang membutuhkan interpretasi semantik yang mendalam.

Dan itu sebabnya penelitian tentang pemodelan humor yang mendalam kurang - terlalu kompleks, atau apa yang peneliti sebut, AI-complete - kategori yang disediakan untuk masalah AI yang paling sulit, di mana menyelesaikan masalah komputasi tertentu sama sulitnya dengan memecahkan masalah buatan pusat pertanyaan intelijen.

Menemukan lelucon

Kami telah mencoba memecahkan formula yang dapat menjelaskan humor selama ribuan tahun, dari Aristoteles hingga Freud, Kierkegaard hingga Monty Python. Teori humor pertama (atau lebih tepatnya, yang pertama kita ketahui) berasal dari Yunani Kuno. Dikenal sebagai Teori Superioritas, ia berpendapat bahwa humor berasal dari kemalangan orang lain. Meskipun ini adalah penjelasan yang sempurna mengapa kita berdecak ketika seseorang tergelincir di trotoar, itu menjelaskan sedikit hal lain. Jauh kemudian, di awal abad ke-20, Freud muncul dengan Teori Pertolongan. Dia mengklaim bahwa humor adalah pelepasan dari hasrat batin kita yang terakumulasi, bahwa itu terjadi ketika kesadaran memungkinkan ekspresi pikiran yang biasanya dilarang. Sangat cocok untuk humor yang kotor, sarkastik, atau bermusuhan, tetapi tetap saja, tidak semua lelucon termasuk dalam kategori ini.

Kemudian, di tahun 70-an, ahli bahasa berdemonstrasi di belakang Teori Ketidaksesuaian: gagasan yang dianut oleh para filsuf Kant dan Schopenhauer bahwa kita menertawakan pelanggaran terhadap harapan kita. Lelucon karena itu adalah usaha dua bagian - itu membutuhkan set-up, penciptaan harapan, dan punch-line, ketika harapan itu ditumbangkan.

Teori ini adalah salah satu yang pertama Diyi Yang, seorang asisten profesor di Sekolah Komputasi Interaktif di Georgia Tech, datang. Kembali pada tahun 2015, ketika dia berada di Carnegie Mellon, Yang dulu bertanya-tanya tentang humor. Bukannya dia sangat peduli pada lelucon: "Saya bukan orang yang lucu, tapi saya suka humor." Humor adalah bagian penting dalam memahami komunikasi manusia. "Saya pikir jika komputer kita dapat memahami humor, mereka dapat lebih memahami arti sebenarnya dari bahasa manusia," katanya. “Jika Anda berpikir tentang semua agen percakapan seperti Google Assistant, Alexa, atau Siri, jika mereka memiliki pemahaman humor yang lebih baik, mereka dapat membuat keputusan yang lebih baik untuk meningkatkan pengalaman pengguna.”

Humor dapat membantunya membangun sistem cerdas yang dapat memberikan interaksi manusia-komputer yang alami dan empatik, sehingga ia melakukan proyek penelitian independen untuk mencoba dan membuat model komputasi untuk menemukan struktur di balik humor, mengenalinya, dan bahkan mengidentifikasi kata-kata mana yang mendorong humor dalam sebuah kalimat.

Yang terjun jauh ke dalam teori-teori humor ahli bahasa, mengidentifikasi beberapa struktur semantik untuk masing-masing yang dapat ia gunakan untuk melatih para model. Salah satunya adalah teori ketidaksesuaian - yang menjelaskan mengapa kita menemukan gambar monyet mengenakan setelan jas dan kasus bisnis yang lucu, atau, mengutip sindiran bertema monyet lainnya: “Mengapa monyet jatuh dari pohon? Karena sudah mati. ”

Teori humor linguistik

Dalam penelitiannya, Yang mempelajari beberapa struktur laten di balik humor yang hadir tidak hanya dalam teori keganjilan, tetapi juga pada tiga lainnya:

  • Kemenduaan. Humor dan ambiguitas sering datang bersamaan ketika pendengar mengharapkan satu makna, tetapi terpaksa menggunakan yang lain.

Apakah Anda mendengar tentang pria yang seluruh sisi kirinya terpotong? Dia baik-baik saja sekarang.

  • Gaya fonetik. Beberapa studi linguistik menunjukkan bahwa sifat fonetik lelucon - aliterasi, pengulangan kata, sajak - dapat sama pentingnya, jika tidak lebih, dari konten itu sendiri. Banyak one-liners memiliki efek komik tertentu bahkan ketika leluconnya tidak selalu lucu. Sebagai contoh:

Ketika Anda melihat satu pusat perbelanjaan, Anda telah melihat sebuah mal.

  • Efek interpersonal - Teori ini menjelaskan bahwa humor pada dasarnya terkait dengan sentimen dan subjektivitas, terutama dalam konteks yang diliputi permusuhan. Itu sebabnya kalimat seperti di bawah ini lucu (ish), meskipun Anda bisa berargumen bahwa hampir tidak ada kecanggihan di sana.

Desamu disebut. Mereka ingin idiot mereka kembali.

Untuk melakukan pengenalan otomatis terhadap humor dan ekstraksi jangkar humor - kata-kata seperti “Knock, knock” yang memberikan petunjuk menuju interaksi humor - Yang membutuhkan kumpulan data dengan contoh-contoh lucu dan tidak-lucu. "Itu tidak mudah untuk melakukan penelitian," kata Yang. "Itu adalah topik yang relatif kurang diselidiki, kami menghabiskan banyak waktu untuk mendapatkan data." Dia biasanya Pun Hari Ini - koleksi permainan kata-kata lucu terbesar di internet— dan 16000 data satu set. Sebagai kelompok kontrol, ia menggunakan berita utama dari AP News, The New York Times, Yahoo! Jawab dan Amsal.

Untuk mengidentifikasi jangkar - kata-kata yang mengatur lelucon - Yang dan rekan-rekannya menguraikan masing-masing satu-liner yang memenuhi kriteria untuk salah satu struktur lucu oleh. Pertimbangkan lelucon berikut:

Saya senang bahwa saya tahu bahasa isyarat; ini sangat berguna.

Jangkar manusia bukanlah kata-kata seperti "tahu", atau "aku", dan mereka bukan pasangan yang "tahu" dan "sangat berguna". Sebaliknya, kombinasi dari "bahasa isyarat" dan "cukup praktis" yang memungkinkan lelucon - tidak peduli seberapa keringnya. Masing-masing kandidat jangkar mendapatkan skor humor yang diprediksi, yang kemudian dihitung oleh pengklasifikasi pengenalan humor yang dilatih pada semua titik data.

Kandidat anchor humor yang memberikan skor terbesar kemudian dikembalikan sebagai set anchor. Hasilnya menjanjikan - mereka menggunakan metode lain untuk pengenalan humor, seperti Bag of Words, Model Bahasa, dan Word2Vec, sebagai baseline, dan mencapai hasil yang lebih baik.

Tapi masih banyak pekerjaan yang harus dilakukan. Terutama karena humor bukan hanya tentang kata-kata.

Semua tentang T * I ​​* M * I * N * G *

Ada lelucon lama yang berbunyi seperti ini:

"Tanyakan padaku rahasia komedi yang bagus."
"Apa yang kedua—"
"Pengaturan waktu!"

Kita semua telah melihat tanah lelucon yang sama dengan indah ketika komedian tertentu mengatakannya, hanya untuk jatuh datar ketika Anda mengatakannya dalam upaya sesat untuk menjadi lucu di pertemuan keluarga. Tapi, seperti yang Rhodri Marsden tunjukkan, “itu adalah kombinasi dari reputasi, momentum, kehadiran dan waktu."Untuk alasan yang jelas, model pelatihan untuk mengenali waktu tidak semudah meminta mereka untuk mendeteksi" sederhana itu yang dia katakan "di akhir kalimat yang diberikan.

Namun tetap saja, ada beberapa penelitian menarik di sana. Amruta Purandare dan Diane Litman dari Program Sistem Cerdas di University of Pittsburgh telah menganalisis 2 jam audio, dari total 75 adegan dari enam episode Friends yang berbeda, menandai setiap pergantian speaker yang diikuti dengan tawa.

Mereka memeriksa fitur akustik dan linguistik tertentu, seperti tempo, nada, jumlah kata dan seberapa sering kata-kata tertentu diulang. Analisis mereka membenarkan sesuatu yang telah kita ketahui selama ini - ada perbedaan signifikan dalam karakteristik prosodis dari ucapan yang lucu dan tidak lucu, yang konsisten di antara gender dan pembicara yang berbeda. Dalam interaksi yang lebih lucu, penutur cenderung memiliki tempo, nada, dan energi yang lebih tinggi, yang konsisten dengan penelitian sebelumnya yang menunjukkan bahwa fitur-fitur ini dikaitkan dengan keadaan emosi positif seperti percaya diri, yang lebih cenderung muncul dalam komunikasi lucu.

Ini juga menunjukkan bahwa, secara mengejutkan, Chandler memiliki interaksi yang lebih lucu pada 75 adegan itu (22.8% dari semua lelucon adalah miliknya), dan lagu tawa itu - yang untungnya popularitasnya telah menurun sejak tahun 80-an dan 90-an - sebenarnya bagus untuk sesuatu.

Penelitian dalam humor komputasi masih dalam tahap yang sangat awal, tetapi komputer tampaknya semakin baik. Masih ada jalan panjang di depan, tapi untungnya, jalan itu ditaburi dengan permainan kata-kata buruk dan satu kalimat curang. Dan sementara juri masih keluar pada apakah “Saya suka kopi saya seperti saya suka perang saya. Dingin." lucu atau tidak, saya, untuk satu, merasa lucu. Saya seorang wanita dengan selera sederhana. Jika itu terlihat seperti lelucon, dan terdengar seperti lelucon, itu mungkin salah satunya.

Sumber: https://unbabel.com/blog/ai-humor/

tempat_img

Intelijen Terbaru

tempat_img