Intelligenza generativa dei dati

Questa intelligenza artificiale ha appena progettato da zero un editor genetico CRISPR più preciso per le cellule umane

Data:

CRISPR ha rivoluzionato la scienza. L’intelligenza artificiale sta ora portando l’editor genetico al livello successivo.

Grazie alla loro capacità di modificare accuratamente il genoma, gli strumenti CRISPR sono ora ampiamente utilizzati nella biotecnologia e in tutta la medicina per affrontare le malattie ereditarie. Alla fine del 2023, una terapia che utilizza il Premio Nobel Lo strumento ha ottenuto l’approvazione della FDA per il trattamento dell’anemia falciforme. Anche CRISPR è stato abilitato Terapia con cellule CAR T per combattere i tumori ed ero abituato abbassare i livelli di colesterolo pericolosamente alti negli studi clinici.

Al di fuori della medicina, lo sono gli strumenti CRISPR modificando il paesaggio agricolo, con progetti in corso da ingegnerizzare tori senza corna, pomodori ricchi di sostanze nutritivee bestiame e pesce con più massa muscolare.

Nonostante il suo impatto nel mondo reale, CRISPR non è perfetto. Lo strumento taglia entrambi i filamenti di DNA, che possono causare mutazioni pericolose. Può anche inavvertitamente stroncare aree indesiderate del genoma e innescare effetti collaterali imprevedibili.

CRISPR è stato scoperto per la prima volta nei batteri come meccanismo di difesa, suggerendo che la natura nasconde una grande quantità di componenti CRISPR. Negli ultimi dieci anni, gli scienziati hanno analizzato diversi ambienti naturali, ad esempio la schiuma degli stagni, per trovare altre versioni dello strumento che potrebbero potenzialmente aumentarne l’efficacia e la precisione. Sebbene abbia successo, questa strategia dipende da ciò che la natura ha da offrire. Alcuni vantaggi, come una dimensione più piccola o una maggiore longevità nel corpo, spesso comportano compromessi come una minore attività o precisione.

Invece di fare affidamento sull’evoluzione, possiamo accelerare il miglioramento degli strumenti CRISPR con l’intelligenza artificiale?

Questa settimana, Profluente, una startup con sede in California, delineato una strategia che utilizza l’intelligenza artificiale per inventare un nuovo universo di editor di geni CRISPR. Basandosi su modelli linguistici di grandi dimensioni, la tecnologia alla base del popolare ChatGPT, l’intelligenza artificiale ha progettato diversi nuovi componenti di modifica genetica.

Nelle cellule umane, i componenti si sono intrecciati per modificare in modo affidabile i geni mirati. L’efficienza corrispondeva al classico CRISPR, ma con molta più precisione. L’editor più promettente, denominato OpenCRISPR-1, potrebbe anche scambiare con precisione singole lettere del DNA – una tecnologia chiamata editing di base – con una precisione che rivaleggia con gli strumenti attuali.

“Dimostriamo il primo editing riuscito al mondo del genoma umano utilizzando un sistema di editing genetico in cui ogni componente è completamente progettato dall’intelligenza artificiale”, ha scritto gli autori in un post sul blog.

Partita fatta in paradiso

CRISPR e AI hanno una lunga storia d’amore.

La ricetta CRISPR è composta da due parti principali: una proteina Cas “a forbice” che taglia o intacca il genoma e una guida RNA “segugio” che lega la proteina a forbice al gene bersaglio.

Variando questi componenti, il sistema diventa una cassetta degli attrezzi, con ogni configurazione su misura per eseguire un tipo specifico di editing genetico. Alcune proteine ​​Cas tagliano entrambi i filamenti del DNA; altri danno un taglio veloce solo a un filo. Versioni alternative possono anche tagliare l’RNA, un tipo di materiale genetico presente nei virus, e possono essere utilizzate come strumenti diagnostici o trattamenti antivirali.

Versioni diverse delle proteine ​​Cas vengono spesso trovate ricercando ambienti naturali o attraverso un processo chiamato evoluzione diretta. In questo caso, gli scienziati sostituiscono razionalmente alcune parti della proteina Cas per aumentare potenzialmente l’efficacia.

È un processo che richiede molto tempo. Ed è qui che entra in gioco l’intelligenza artificiale.

L’apprendimento automatico ha già aiutato prevedere effetti fuori bersaglio negli strumenti CRISPR. È anche a casa su proteine ​​Cas più piccole per rendere più facile la distribuzione degli editor ridimensionati nelle cellule.

Profluent ha utilizzato l’intelligenza artificiale in un modo nuovo: invece di potenziare i sistemi attuali, ha progettato i componenti CRISPR da zero utilizzando modelli linguistici di grandi dimensioni.

Base di ChatGPT e DALL-E, questi modelli hanno lanciato l'intelligenza artificiale nel mainstream. Imparano da enormi quantità di testo, immagini, musica e altri dati per distillare modelli e concetti. È così che gli algoritmi generano immagini da un singolo messaggio di testo, ad esempio "unicorno con occhiali da sole che danzano sopra un arcobaleno", o imitano lo stile musicale di un determinato artista.

La stessa tecnologia ha anche trasformato il mondo della progettazione delle proteine. Come le parole in un libro, le proteine ​​sono legate da singole “lettere” molecolari in catene, che poi si piegano in modi specifici per far funzionare le proteine. Inserendo sequenze proteiche nell'intelligenza artificiale, gli scienziati lo hanno già fatto anticorpi modellati e altro proteine ​​funzionali sconosciute alla natura.

“I grandi modelli di linguaggio proteico generativo catturano il progetto sottostante di ciò che rende funzionale una proteina naturale”, ha scritto il team nel post del blog. “Promettono una scorciatoia per aggirare il processo casuale dell’evoluzione e spingerci verso la progettazione intenzionale di proteine ​​per uno scopo specifico”.

Le IA sognano le pecore CRISPR?

Tutti i modelli linguistici di grandi dimensioni necessitano di dati di addestramento. Lo stesso vale per un algoritmo che genera editor genetici. A differenza di testo, immagini o video che possono essere facilmente recuperati online, un database CRISPR è più difficile da trovare.

Il team ha innanzitutto analizzato oltre 26 terabyte di dati sugli attuali sistemi CRISPR e ha creato un atlante CRISPR-Cas, il più ampio mai realizzato fino ad oggi, secondo i ricercatori.

La ricerca ha rivelato milioni di componenti CRISPR-Cas. La squadra ha poi allenato i propri Modello linguistico ProGen2– che è stato messo a punto per la scoperta delle proteine ​​– utilizzando l’atlante CRISPR.

Alla fine l’intelligenza artificiale ha generato quattro milioni di sequenze proteiche con potenziale attività Cas. Dopo aver filtrato gli evidenti errori con un altro programma per computer, il team si è concentrato su un nuovo universo di “forbici proteiche” di Cas.

L’algoritmo non si è limitato a inventare proteine ​​come Cas9. Le proteine ​​Cas si presentano in famiglie, ciascuna con le proprie peculiarità nella capacità di modificazione genetica. L’intelligenza artificiale ha anche progettato proteine ​​simili a Cas13, che prende di mira l’RNA, e Cas12a, che è più compatta di Cas9.

Nel complesso, i risultati hanno ampliato l’universo delle potenziali proteine ​​Cas di quasi cinque volte. Ma qualcuno di loro funziona?

Ciao, mondo CRISPR

Per il prossimo test, il team si è concentrato su Cas9, perché è già ampiamente utilizzato in campi biomedici e in altri campi. Hanno addestrato l’intelligenza artificiale su circa 240,000 diverse strutture proteiche Cas9 provenienti da diversi tipi di animali, con l’obiettivo di generare proteine ​​simili per sostituire quelle naturali, ma con maggiore efficacia e precisione.

I risultati iniziali sono stati sorprendenti: le sequenze generate, circa un milione, erano totalmente diverse dalle proteine ​​Cas9 naturali. Ma utilizzando AlphaFold2 di DeepMind, un’intelligenza artificiale per la previsione della struttura delle proteine, il team ha scoperto che le sequenze proteiche generate potrebbero adottare forme simili.

Le proteine ​​Cas non possono funzionare senza una guida RNA di segugio. Con l’atlante CRISPR-Cas, il team ha anche addestrato l’intelligenza artificiale a generare una guida di RNA quando viene fornita una sequenza proteica.

Il risultato è un editor genetico CRISPR con entrambi i componenti, la proteina Cas e la guida dell’RNA, progettato dall’intelligenza artificiale. Soprannominato OpenCRISPR-1, la sua attività di modifica genetica era simile ai classici sistemi CRISPR-Cas9 quando testata su cellule renali umane in coltura. Sorprendentemente, la versione generata dall’intelligenza artificiale ha ridotto le modifiche fuori target di circa il 95%.

Con alcune modifiche, OpenCRISPR-1 potrebbe anche eseguire l’editing di base, che può modificare singole lettere del DNA. Rispetto al classico CRISPR, l’editing di base è probabilmente più preciso in quanto limita i danni al genoma. Nelle cellule renali umane, OpenCRISPR-1 ha convertito in modo affidabile una lettera di DNA in un’altra in tre siti attraverso il genoma, con una velocità di modifica simile agli attuali editor di base.

Per essere chiari, gli strumenti CRISPR generati dall’intelligenza artificiale sono stati testati solo su cellule in una piastra. Affinché i trattamenti possano raggiungere la clinica, dovrebbero essere sottoposti ad accurati test per verificarne la sicurezza e l'efficacia nelle creature viventi, il che può richiedere molto tempo.

Profluent condivide apertamente OpenCRISPR-1 con ricercatori e gruppi commerciali, mantenendo internamente l'intelligenza artificiale che ha creato lo strumento. "Rilasciamo OpenCRISPR-1 pubblicamente per facilitare un utilizzo ampio ed etico nella ricerca e nelle applicazioni commerciali", hanno scritto.

In versione prestampa, il documento che descrive il loro lavoro deve ancora essere analizzato da esperti revisori paritari. Gli scienziati dovranno anche dimostrare che OpenCRISPR-1 o le sue varianti funzionano in più organismi, tra cui piante, topi e esseri umani. Ma, cosa interessante, i risultati aprono una nuova strada per l’intelligenza artificiale generativa, che potrebbe cambiare radicalmente il nostro progetto genetico.

Immagine di credito: Profluente

spot_img

L'ultima intelligenza

spot_img

Parla con noi

Ciao! Come posso aiutarla?