Kecerdasan Data Generatif

DeepMind AI Memburu Mutasi DNA di Balik Penyakit Genetik

Tanggal:

Protein itu seperti Spider-Man di multisemesta.

Kisah mendasarnya sama: setiap bahan penyusun protein didasarkan pada kode DNA tiga huruf. Namun, jika satu huruf diubah, maka protein yang sama akan menjadi versi yang berbeda. Jika beruntung, beberapa mutan ini masih dapat menjalankan fungsi normalnya.

Saat kita kurang beruntung, satu perubahan huruf DNA memicu berbagai kelainan bawaan, seperti fibrosis kistik dan penyakit sel sabit. Selama beberapa dekade, para ahli genetika telah memburu mutasi penyebab penyakit ini dengan memeriksa gen-gen yang dimiliki bersama dalam silsilah keluarga. Setelah ditemukan, alat penyunting gen seperti CRISPR mulai membantu memperbaiki kesalahan ketik genetik dan membawa obat yang mengubah hidup.

Masalah? Ada lebih dari 70 juta kemungkinan pertukaran huruf DNA dalam genom manusia. Bahkan dengan munculnya pengurutan DNA dengan throughput tinggi, para ilmuwan dengan susah payah hanya menemukan sedikit potensi mutasi yang terkait dengan penyakit.

Minggu ini, Google DeepMind membawa alat baru ke meja: AlphaMissense. Berdasarkan Lipatan Alfa, algoritme blockbuster mereka untuk memprediksi struktur protein, algoritme baru ini menganalisis urutan DNA dan menentukan pertukaran huruf DNA mana yang kemungkinan besar menyebabkan penyakit.

Alat ini hanya berfokus pada perubahan huruf DNA tunggal yang disebut “mutasi missense”. Dalam beberapa pengujian, mereka mengkategorikan 89 persen dari puluhan juta kemungkinan kesalahan ketik genetik sebagai jinak atau patogen, kata DeepMind.

AlphaMissense memperluas karya DeepMind di bidang biologi. Daripada hanya berfokus pada struktur protein, alat baru ini langsung menuju ke kode sumbernya—DNA. Hanya sepersepuluh persen mutasi missense pada DNA manusia yang telah dipetakan menggunakan taktik laboratorium klasik. AlphaMissense membuka dunia genetik baru di mana para ilmuwan dapat mengeksplorasi target penyakit bawaan.

“Pengetahuan ini sangat penting untuk diagnosis yang lebih cepat” menulis penulis dalam postingan blog, dan untuk mengetahui “akar penyebab penyakit”.

Untuk saat ini, perusahaan hanya merilis katalog prediksi AlphaMissense, bukan kodenya sendiri. Mereka juga memperingatkan bahwa algoritma tersebut tidak dimaksudkan untuk diagnosis. Sebaliknya, hal ini harus dilihat lebih seperti garis petunjuk mutasi penyebab penyakit. Para ilmuwan harus memeriksa dan memvalidasi setiap tip menggunakan sampel biologis.

“Pada akhirnya, kami berharap AlphaMissense, bersama dengan alat lainnya, akan memungkinkan para peneliti untuk lebih memahami penyakit dan mengembangkan pengobatan baru yang dapat menyelamatkan nyawa,” kata penulis studi Žiga Avsec dan Jun Cheng di DeepMind.

Mari Bicara Protein

Pengenalan singkat tentang protein. Molekul-molekul ini terbuat dari instruksi genetik dalam DNA kita yang diwakili oleh empat huruf: A, T, C, dan G. Kombinasi tiga huruf ini mengkode bahan penyusun dasar protein—asam amino. Protein terdiri dari 20 jenis asam amino yang berbeda.

Evolusi memprogram redundansi ke dalam proses penerjemahan DNA ke protein. Beberapa kode DNA tiga digit menghasilkan asam amino yang sama. Bahkan jika beberapa huruf DNA bermutasi, tubuh masih dapat membangun protein yang sama dan mengirimkannya ke tempat kerja normalnya tanpa masalah.

Masalahnya adalah ketika satu perubahan huruf melibas keseluruhan operasi.

Para ilmuwan telah lama mengetahui bahwa kesalahan yang salah ini menyebabkan konsekuensi kesehatan yang buruk. Namun memburu mereka membutuhkan kerja keras selama bertahun-tahun. Untuk melakukan hal ini, para ilmuwan secara manual mengedit urutan DNA dalam gen yang mencurigakan—huruf demi huruf—menjadikannya menjadi protein, kemudian mengamati fungsi biologisnya untuk memburu mutasi missense. Dengan ratusan tersangka potensial, untuk mengetahui satu mutasi bisa memakan waktu bertahun-tahun.

Bisakah kita mempercepatnya? Masuki pikiran mesin.

Pembelajaran AI ATCG

DeepMind bergabung dengan bidang yang sedang berkembang yang menggunakan perangkat lunak untuk memprediksi mutasi penyebab penyakit.

Dibandingkan dengan metode komputasi sebelumnya, AlphaMissense memiliki keunggulan. Alat ini memanfaatkan pembelajaran dari algoritma pendahulunya, AlphaFold. Dikenal karena memecahkan prediksi struktur protein—tantangan besar di bidangnya—AlphaFold termasuk dalam hall-of-fame biologi algoritmik.

AlphaFold memprediksi struktur protein—yang sering kali menentukan fungsinya—berdasarkan rangkaian asam amino saja. Di sini, AlphaMissense menggunakan “intuisi” AlphaFold tentang struktur protein untuk memprediksi apakah suatu mutasi bersifat jinak atau merugikan, kata penulis studi dan wakil presiden penelitian DeepMind, Dr. Pushmeet Kohli pada konferensi pers.

AI juga memanfaatkan pendekatan model bahasa besar. Dengan cara ini, ini mirip dengan GPT-4, AI di balik ChatGPT, yang hanya dirancang ulang untuk memecahkan kode bahasa protein. Editor algoritmik ini hebat dalam memahami varian protein dan menandai urutan mana yang masuk akal secara biologis dan mana yang tidak. Bagi Avsec, itulah kekuatan super AlphaMissense. Ia sudah mengetahui aturan permainan protein—yaitu, ia mengetahui urutan mana yang berhasil dan mana yang gagal.

Sebagai pembuktian konsep, tim menggunakan database standar varian missense yang disebut ClinVar, untuk menantang sistem AI mereka. Kesalahan ketik genetik ini menyebabkan berbagai gangguan perkembangan. AlphaMissense mengungguli model yang ada dalam menemukan mutasi penyebab penyakit.

Pengubah Permainan?

Memprediksi struktur protein dapat berguna untuk menstabilkan obat protein dan menentukan sifat biofisik lainnya. Namun, penyelesaian struktur saja “umumnya hanya memberikan sedikit manfaat” dalam memprediksi varian yang menyebabkan penyakit, kata para penulis.

Dengan AlphaMissense, DeepMind ingin membalikkan keadaan.

Tim ini merilis seluruh database potensi mutasi penyebab penyakit kepada publik. Secara keseluruhan, mereka memburu 32 persen dari semua varian virus yang kemungkinan memicu penyakit dan 57 persen yang kemungkinan tidak berbahaya. Algoritma ini menggabungkan algoritma lain di lapangan, seperti PrimataAI, pertama kali dirilis pada tahun 2018 untuk menyaring mutan berbahaya.

Yang jelas: hasilnya hanya prediksi. Para ilmuwan harus memvalidasi petunjuk yang dihasilkan AI ini dalam eksperimen laboratorium. AlphaMissense memberikan “hanya satu bukti,” kata Dr. Heidi Rehm dari Broad Institute, yang tidak terlibat dalam penelitian ini.

Namun demikian, model AI telah menghasilkan database yang dapat dimanfaatkan oleh para ilmuwan “sebagai titik awal untuk merancang dan menafsirkan eksperimen,” kata tim tersebut.

Ke depannya, AlphaMissense kemungkinan harus mengatasinya kompleks protein, kata Marsh dan Teichmann. Arsitektur biologis yang canggih ini sangat penting bagi kehidupan. Mutasi apa pun dapat merusak struktur halusnya, menyebabkan gangguan fungsi, dan menyebabkan penyakit. Laboratorium Dr. David Baker di Universitas Washington—pelopor lain dalam prediksi struktur protein—telah mulai menggunakan pembelajaran mesin untuk jelajahi katedral protein ini.

Untuk saat ini, tidak ada satu alat pun yang dapat memprediksi mutasi DNA penyebab penyakit yang dapat diandalkan untuk mendiagnosis penyakit genetik, karena gejalanya sering kali diakibatkan oleh mutasi bawaan dan isyarat lingkungan. Hal ini juga berlaku untuk AlphaMissense. Namun seiring kemajuan algoritma—dan interpretasi hasilnya—penggunaannya dalam “pengembaraan diagnostik akan terus meningkat,” kata mereka.

Gambar Kredit: Google DeepMind / Unsplash

tempat_img

Intelijen Terbaru

tempat_img