Intelligence de données générative

Cette IA vient de concevoir un éditeur de gènes CRISPR plus précis pour les cellules humaines à partir de zéro

Date :

CRISPR a révolutionné la science. L’IA fait désormais passer l’éditeur de gènes à un niveau supérieur.

Grâce à leur capacité à modifier avec précision le génome, les outils CRISPR sont désormais largement utilisés en biotechnologie et en médecine pour lutter contre les maladies héréditaires. Fin 2023, une thérapie utilisant le Prix ​​Nobel L'outil a obtenu l'approbation de la FDA pour traiter la drépanocytose. CRISPR a également permis Thérapie cellulaire CAR T pour lutter contre les cancers et j'ai été habitué à abaisser les taux de cholestérol dangereusement élevés dans les essais cliniques.

En dehors de la médecine, les outils CRISPR sont changer le paysage agricole, avec des projets en cours pour concevoir taureaux sans cornes, tomates riches en nutrimentset bétail et poisson avec plus de masse musculaire.

Malgré son impact réel, CRISPR n'est pas parfait. L’outil coupe les deux brins d’ADN, ce qui peut provoquer des mutations dangereuses. Cela peut également étouffer par inadvertance des zones involontaires du génome et déclencher des effets secondaires imprévisibles.

CRISPR a été découvert pour la première fois dans des bactéries comme mécanisme de défense, ce qui suggère que la nature cache une multitude de composants CRISPR. Au cours de la dernière décennie, les scientifiques ont examiné différents environnements naturels, par exemple l'écume des étangs, pour trouver d'autres versions de l'outil susceptibles d'augmenter son efficacité et sa précision. Même si elle réussit, cette stratégie dépend de ce que la nature a à offrir. Certains avantages, comme une taille plus petite ou une plus grande longévité du corps, s’accompagnent souvent de compromis comme une activité ou une précision moindre.

Plutôt que de compter sur l’évolution, pouvons-nous accélérer la mise au point de meilleurs outils CRISPR grâce à l’IA ?

Cette semaine, Courant, une startup basée en Californie, a esquissé une stratégie qui utilise l'IA pour imaginer un nouvel univers d'éditeurs de gènes CRISPR. Basée sur de grands modèles de langage (la technologie derrière le populaire ChatGPT), l'IA a conçu plusieurs nouveaux composants d'édition génétique.

Dans les cellules humaines, les composants se sont intégrés pour modifier de manière fiable les gènes ciblés. L'efficacité correspondait au CRISPR classique, mais avec beaucoup plus de précision. L’éditeur le plus prometteur, baptisé OpenCRISPR-1, pourrait également échanger avec précision des lettres d’ADN uniques – une technologie appelée édition de base – avec une précision qui rivalise avec les outils actuels.

« Nous démontrons la première édition réussie au monde du génome humain à l'aide d'un système d'édition génétique où chaque composant est entièrement conçu par l'IA. » écrit les auteurs dans un article de blog.

Match Made in Heaven

CRISPR et l’IA entretiennent une longue histoire d’amour.

La recette CRISPR comprend deux parties principales : une protéine Cas « en ciseaux » qui coupe ou entaille le génome et un guide d'ARN « chien de sang » qui attache la protéine en ciseaux au gène cible.

En faisant varier ces composants, le système devient une boîte à outils, chaque configuration étant adaptée pour effectuer un type spécifique d’édition génétique. Certaines protéines Cas coupent les deux brins d’ADN ; d’autres coupent rapidement un seul brin. Des versions alternatives peuvent également couper l’ARN, un type de matériel génétique présent dans les virus, et peuvent être utilisées comme outils de diagnostic ou traitements antiviraux.

Différentes versions de protéines Cas sont souvent trouvées en recherchant des environnements naturels ou via un processus appelé évolution directe. Ici, les scientifiques remplacent rationnellement certaines parties de la protéine Cas pour potentiellement augmenter l’efficacité.

C'est un processus qui prend beaucoup de temps. C’est là qu’intervient l’IA.

L'apprentissage automatique a déjà aidé prédire les effets hors cible dans les outils CRISPR. C'est aussi hébergé dans sur des protéines Cas plus petites pour faciliter la distribution des éditeurs réduits dans les cellules.

Profluent a utilisé l'IA d'une manière nouvelle : plutôt que de renforcer les systèmes actuels, ils ont conçu des composants CRISPR à partir de zéro en utilisant de grands modèles de langage.

Basés sur ChatGPT et DALL-E, ces modèles ont lancé l’IA dans le grand public. Ils apprennent à partir d’énormes quantités de texte, d’images, de musique et d’autres données pour distiller des modèles et des concepts. C'est ainsi que les algorithmes génèrent des images à partir d'une seule invite de texte (par exemple, « licorne avec des lunettes de soleil dansant sur un arc-en-ciel ») ou imitent le style musical d'un artiste donné.

La même technologie a également a transformé le monde de la conception de protéines. Comme les mots dans un livre, les protéines sont reliées à partir de « lettres » moléculaires individuelles en chaînes, qui se replient ensuite de manière spécifique pour faire fonctionner les protéines. En alimentant l’IA en séquences protéiques, les scientifiques ont déjà anticorps façonnés et d'autres protéines fonctionnelles inconnues de la nature.

« Les grands modèles génératifs de langage protéique capturent le schéma sous-jacent de ce qui rend une protéine naturelle fonctionnelle » écrit l'équipe dans le billet de blog. "Ils promettent un raccourci pour contourner le processus aléatoire de l'évolution et nous amener à concevoir intentionnellement des protéines dans un but spécifique."

Les IA rêvent-elles de moutons CRISPR ?

Tous les grands modèles de langage ont besoin de données de formation. Il en va de même pour un algorithme qui génère des éditeurs de gènes. Contrairement au texte, aux images ou aux vidéos qui peuvent être facilement récupérés en ligne, une base de données CRISPR est plus difficile à trouver.

L’équipe a d’abord examiné plus de 26 téraoctets de données sur les systèmes CRISPR actuels et a construit un atlas CRISPR-Cas, le plus complet à ce jour, selon les chercheurs.

La recherche a révélé des millions de composants CRISPR-Cas. L'équipe a ensuite formé ses Modèle de langage ProGen2- qui a été affiné pour la découverte de protéines - à l'aide de l'atlas CRISPR.

L’IA a finalement généré quatre millions de séquences protéiques présentant une activité potentielle Cas. Après avoir filtré les mauvais payeurs évidents avec un autre programme informatique, l’équipe s’est concentrée sur un nouvel univers de « ciseaux à protéines » Cas.

L’algorithme n’a pas seulement imaginé des protéines comme Cas9. Les protéines Cas se répartissent en familles, chacune avec ses propres particularités en matière de capacité d'édition de gènes. L’IA a également conçu des protéines ressemblant à Cas13, qui cible l’ARN, et à Cas12a, qui est plus compacte que Cas9.

Dans l’ensemble, les résultats ont multiplié par cinq l’univers des protéines Cas potentielles. Mais est-ce que l'un d'entre eux fonctionne ?

Bonjour, CRISPR Monde

Pour le prochain test, l'équipe s'est concentrée sur Cas9, car il est déjà largement utilisé dans les domaines biomédical et autres. Ils ont entraîné l’IA sur environ 240,000 9 structures protéiques CasXNUMX différentes provenant de plusieurs types d’animaux, dans le but de générer des protéines similaires pour remplacer les protéines naturelles, mais avec une efficacité ou une précision plus élevée.

Les premiers résultats ont été surprenants : les séquences générées, soit environ un million, étaient totalement différentes des protéines Cas9 naturelles. Mais en utilisant AlphaFold2 de DeepMind, une IA de prédiction de la structure des protéines, l'équipe a découvert que les séquences protéiques générées pouvaient adopter des formes similaires.

Les protéines Cas ne peuvent pas fonctionner sans un guide d'ARN Bloodhound. Avec l’atlas CRISPR-Cas, l’équipe a également entraîné l’IA à générer un guide d’ARN lorsqu’on lui donne une séquence protéique.

Le résultat est un éditeur de gènes CRISPR avec les deux composants (protéine Cas et guide ARN) conçus par l'IA. Baptisé OpenCRISPR-1, son activité d’édition génétique était similaire aux systèmes CRISPR-Cas9 classiques lorsqu’elle était testée sur des cellules rénales humaines en culture. Étonnamment, la version générée par l’IA a réduit d’environ 95 % les modifications hors cible.

Avec quelques ajustements, OpenCRISPR-1 pourrait également effectuer une édition de base, qui pourrait modifier des lettres ADN uniques. Par rapport au CRISPR classique, l’édition de bases est probablement plus précise car elle limite les dommages causés au génome. Dans les cellules rénales humaines, OpenCRISPR-1 a converti de manière fiable une lettre d'ADN en une autre dans trois sites du génome, avec un taux d'édition similaire à celui des éditeurs de base actuels.

Pour être clair, les outils CRISPR générés par l’IA n’ont été testés que sur des cellules dans une boîte. Pour que les traitements parviennent à la clinique, ils devront être soumis à des tests minutieux de sécurité et d’efficacité sur les créatures vivantes, ce qui peut prendre beaucoup de temps.

Profluent partage ouvertement OpenCRISPR-1 avec des chercheurs et des groupes commerciaux, tout en conservant l'IA qui a créé l'outil en interne. "Nous publions OpenCRISPR-1 publiquement pour faciliter une utilisation large et éthique dans la recherche et les applications commerciales", ont-ils écrit.

En tant que prépublication, l'article décrivant leur travail n'a pas encore été analysé par des pairs évaluateurs experts. Les scientifiques devront également montrer qu’OpenCRISPR-1 ou ses variantes fonctionnent dans plusieurs organismes, notamment les plantes, les souris et les humains. Mais, curieusement, ces résultats ouvrent une nouvelle voie à l’IA générative, qui pourrait modifier fondamentalement notre schéma génétique.

Crédit image: Courant

spot_img

Dernières informations

spot_img

Discutez avec nous

Salut! Comment puis-je t'aider?