Generatiivinen tiedustelu

DeepMind AI etsii geneettisten sairauksien taustalla olevia DNA-mutaatioita

Treffi:

Proteiinit ovat kuin Hämähäkkimies multiversessa.

Taustalla on sama tarina: jokainen proteiinin rakennuspalikka perustuu kolmikirjaimiseen DNA-koodiin. Vaihda kuitenkin yksi kirjain, ja samasta proteiinista tulee erilainen versio itsestään. Jos olemme onnekkaita, jotkut näistä mutanteista voivat silti suorittaa normaalit tehtävänsä.

Kun olemme epäonnisia, yksi DNA-kirjaimen muutos laukaisee lukemattomia perinnöllisiä sairauksia, kuten kystisen fibroosin ja sirppisolusairauden. Geneetikot ovat vuosikymmeniä metsästäneet näitä sairauksia aiheuttavia mutaatioita tutkimalla yhteisiä geenejä sukupuissa. Kun geeninmuokkaustyökalut on löydetty, esim CRISPR ovat alkaneet auttaa korjaamaan geneettisiä kirjoitusvirheitä ja tuoda elämää muuttava parannuskeino.

Ongelma? Ihmisen genomissa on yli 70 miljoonaa mahdollista DNA-kirjaimen vaihtoa. Jopa korkean suorituskyvyn DNA-sekvensoinnin tultua käyttöön, tutkijat ovat vaivalloisesti paljastaneet vain osan mahdollisista sairauksiin liittyvistä mutaatioista.

Tällä viikolla Google DeepMind toi uuden työkalun pöytään: AlphaMissense. Perustuen AlphaFoldUusi algoritmi analysoi DNA-sekvenssejä ja selvittää, mitkä DNA-kirjainten vaihdot todennäköisesti johtavat sairauteen.

Työkalu keskittyy vain yksittäisiin DNA-kirjaimen muutoksiin, joita kutsutaan "missense-mutaatioiksi". Useissa testeissä se luokitteli 89 prosenttia kymmenistä miljoonista mahdollisista geneettisistä kirjoitusvirheistä joko hyvänlaatuisiksi tai patogeenisiksi, DeepMind sanoi.

AlphaMissense laajentaa DeepMindin työtä biologian alalla. Sen sijaan, että se keskittyisi vain proteiinin rakenteeseen, uusi työkalu siirtyy suoraan lähdekoodiin - DNA:han. Vain kymmenesosa ihmisen DNA:n missense-mutaatioista on kartoitettu klassisilla laboratoriotaktiikoilla. AlphaMissense avaa uuden geneettisen universumin, jossa tutkijat voivat tutkia perinnöllisten sairauksien kohteita.

"Tämä tieto on ratkaisevan tärkeää nopeammassa diagnoosissa" kirjoitti kirjoittajat blogitekstissä ja päästäkseen "sairauden perimmäiseen syyyn".

Toistaiseksi yritys julkaisee vain AlphaMissense-ennusteiden luettelon itse koodin sijaan. He myös varoittavat, että algoritmia ei ole tarkoitettu diagnoosien tekemiseen. Pikemminkin sitä pitäisi nähdä enemmän vihjeenä sairauksia aiheuttaville mutaatioille. Tutkijoiden on tutkittava ja validoitava jokainen kärki biologisten näytteiden avulla.

"Lopulta toivomme, että AlphaMissense yhdessä muiden työkalujen kanssa antaa tutkijoille mahdollisuuden ymmärtää paremmin sairauksia ja kehittää uusia hengenpelastusmenetelmiä", sanoivat tutkimuksen kirjoittajat Žiga Avsec ja Jun Cheng DeepMindistä.

Puhutaan proteiineista

Pikainen johdatus proteiineihin. Nämä molekyylit valmistetaan DNA:ssamme olevista geneettisistä ohjeista, joita edustavat neljä kirjainta: A, T, C ja G. Kolmen näistä kirjaimista yhdistäminen koodaa proteiinin perusrakennuspalikoita – aminohappoa. Proteiinit koostuvat 20 erilaisesta aminohappotyypistä.

Evoluutio ohjelmoi redundanssin DNA:sta proteiiniksi translaatioprosessiin. Useat kolminumeroiset DNA-koodit luovat saman aminohapon. Vaikka jotkin DNA-kirjaimet muuntuisivat, keho voi silti rakentaa samat proteiinit ja lähettää ne normaaliin työasemaansa ilman ongelmia.

Ongelmana on se, että yksi kirjaimen vaihto häiritsee koko toimintoa.

Tiedemiehet ovat pitkään tienneet, että nämä missense-virheet johtavat tuhoisiin terveysvaikutuksiin. Mutta niiden metsästäminen on vaatinut vuosia ikävää työtä. Tätä varten tutkijat muokkaavat manuaalisesti epäilyttävän geenin DNA-sekvenssejä - kirjain kirjaimelta - tekevät niistä proteiineja ja tarkkailevat sitten niiden biologisia toimintoja löytääkseen missense-mutaation. Kun on satoja potentiaalisia epäiltyjä, yhden mutaation naulaaminen voi kestää vuosia.

Voimmeko nopeuttaa sitä? Sisään koneen mielet.

AI Learning ATCG

DeepMind liittyy kasvavaan kenttään, joka ennustaa sairauksia aiheuttavia mutaatioita ohjelmistojen avulla.

Verrattuna aikaisempiin laskentamenetelmiin AlphaMissense on ylhäällä. Työkalu hyödyntää edeltäjänsä AlphaFold-algoritmin oppimista. AlphaFold, joka tunnetaan proteiinirakenteen ennustamisen ratkaisemisesta – suuri haaste alalla – on algoritmisen biologian hall of famessa.

AlphaFold ennustaa proteiinirakenteita – jotka usein määrittävät toiminnan – pelkästään aminohapposekvenssien perusteella. Tässä AlphaMissense käyttää AlphaFoldin "intuitiota" proteiinirakenteista ennustaakseen, onko mutaatio hyvänlaatuinen vai haitallinen, tutkimuksen kirjoittaja ja DeepMindin tutkimuksen varapuheenjohtaja tohtori Pushmeet Kohli sanoi lehdistötilaisuudessa.

Tekoäly hyödyntää myös laajan kielimallin lähestymistapaa. Tällä tavalla se on vähän kuin GPT-4, ChatGPT:n taustalla oleva tekoäly, joka on vain rejiggered purkaa proteiinien kielen. Nämä algoritmiset editorit ovat erinomaisia ​​proteiinimuunnelmien löytämisessä ja merkitsemään, mitkä sekvenssit ovat biologisesti uskottavia ja mitkä eivät. Avsecille se on AlphaMissensen supervoima. Se tuntee jo proteiinipelin säännöt – eli se tietää, mitkä sekvenssit toimivat ja mitkä epäonnistuvat.

Todisteeksi käsitteestä tiimi käytti standardoitua tietokantaa missense-varianteista, ns ClinVar, haastaa heidän tekoälyjärjestelmänsä. Nämä geneettiset kirjoitusvirheet johtavat useisiin kehityshäiriöihin. AlphaMissense ylitti olemassa olevat mallit sairauksia aiheuttavien mutaatioiden naulaamiseksi.

Pelinvaihtaja?

Proteiinirakenteiden ennustaminen voi olla hyödyllistä proteiinilääkkeiden stabiloinnissa ja muiden biofysikaalisten ominaisuuksien naulaamisessa. Kuitenkin rakenteen ratkaisemisesta yksinään on "yleensä ollut vähän hyötyä" sairauksia aiheuttavien muunnelmien ennustamisessa, kirjoittajat sanoivat.

AlphaMissensen avulla DeepMind haluaa kääntää vuoroveden.

Ryhmä julkaisee koko tietokantansa mahdollisista sairauksia aiheuttavista mutaatioista yleisölle. Kaiken kaikkiaan he metsästivät 32 prosenttia kaikista missense-muunnelmista, jotka todennäköisesti laukaisevat sairauksia, ja 57 prosenttia, jotka ovat todennäköisesti hyvänlaatuisia. Algoritmi liittyy muihin alan toimijoihin, kuten PrimateAI, julkaistiin ensimmäisen kerran vuonna 2018 vaarallisten mutanttien seulomiseksi.

Selvyyden vuoksi: tulokset ovat vain ennusteita. Tutkijoiden on validoitava nämä tekoälyn tuottamat johdot laboratoriokokeissa. AlphaMissense tarjoaa "vain yhden todisteen", sanoi tohtori Heidi Rehm Broad Institutesta, joka ei ollut mukana työhön.

Siitä huolimatta tekoälymalli on jo luonut tietokannan, jota tutkijat voivat hyödyntää "lähtökohtana kokeiden suunnittelulle ja tulkinnalle", tiimi sanoi.

Eteenpäin AlphaMissensen on todennäköisesti tartuttava proteiinikompleksit, sanoi Marsh ja Teichmann. Nämä hienostuneet biologiset arkkitehtuurit ovat elämän perusta. Kaikki mutaatiot voivat murtaa niiden herkän rakenteen, aiheuttaa niiden toimintahäiriöitä ja johtaa sairauksiin. Tohtori David Bakerin laboratorio Washingtonin yliopistossa – toinen proteiinirakenteen ennustamisen pioneeri – on jo alkanut käyttää koneoppimista tutkia näitä proteiinikatedraaleja.

Toistaiseksi geneettisten sairauksien diagnosoinnissa ei voida luottaa yhteenkään sairauksia aiheuttavia DNA-mutaatioita ennustavaan työkaluun, koska oireet johtuvat usein sekä perinnöllisistä mutaatioista että ympäristön vihjeistä. Tämä koskee myös AlphaMissenseä. Mutta kun algoritmi - ja sen tulosten tulkinta - edistyy, sen käyttö "diagnostisessa odysseiassa paranee edelleen", he sanoivat.

Kuva pistetilanne: Google DeepMind / Unsplash

spot_img

Uusin älykkyys

spot_img