Inteligência de dados generativa

Esta IA acaba de projetar um editor de gene CRISPR mais preciso para células humanas do zero

Data:

CRISPR revolucionou a ciência. A IA agora está levando o editor de genes para o próximo nível.

Graças à sua capacidade de editar com precisão o genoma, as ferramentas CRISPR são agora amplamente utilizadas na biotecnologia e na medicina para combater doenças hereditárias. No final de 2023, uma terapia usando o Prêmio Nobel ferramenta obteve aprovação do FDA para tratar a doença falciforme. CRISPR também permitiu Terapia com células T CAR para combater o câncer e estava acostumado reduzir níveis perigosamente elevados de colesterol em ensaios clínicos.

Fora da medicina, as ferramentas CRISPR são mudando a paisagem agrícola, com projetos em andamento para engenharia touros sem chifres, tomates ricos em nutrientes e gado e peixes com mais massa muscular.

Apesar do seu impacto no mundo real, o CRISPR não é perfeito. A ferramenta corta ambas as cadeias de DNA, o que pode causar mutações perigosas. Ele também pode cortar inadvertidamente áreas indesejadas do genoma e desencadear efeitos colaterais imprevisíveis.

O CRISPR foi descoberto pela primeira vez em bactérias como mecanismo de defesa, sugerindo que a natureza esconde uma abundância de componentes do CRISPR. Durante a última década, os cientistas examinaram diferentes ambientes naturais – por exemplo, resíduos de lagos – para encontrar outras versões da ferramenta que pudessem potencialmente aumentar a sua eficácia e precisão. Embora bem sucedida, esta estratégia depende do que a natureza tem para oferecer. Alguns benefícios, como um tamanho menor ou maior longevidade do corpo, muitas vezes vêm com compensações, como menor atividade ou precisão.

Em vez de confiar na evolução, podemos acelerar melhores ferramentas CRISPR com IA?

Esta semana, Profluente, uma startup com sede na Califórnia, traçou uma estratégia que usa IA para criar um novo universo de editores de genes CRISPR. Com base em grandes modelos de linguagem – a tecnologia por trás do popular ChatGPT – a IA projetou vários novos componentes de edição genética.

Nas células humanas, os componentes se mesclaram para editar de forma confiável os genes alvo. A eficiência correspondeu ao CRISPR clássico, mas com muito mais precisão. O editor mais promissor, apelidado de OpenCRISPR-1, também poderia trocar com precisão letras únicas de DNA – uma tecnologia chamada edição de base – com uma precisão que rivaliza com as ferramentas atuais.

“Demonstramos a primeira edição bem-sucedida do genoma humano no mundo usando um sistema de edição de genes onde cada componente é totalmente projetado por IA”, escreveu os autores em uma postagem no blog.

Casamento feito no céu

CRISPR e AI tiveram um longo romance.

A receita CRISPR tem duas partes principais: uma proteína Cas “tesoura” que corta ou corta o genoma e um guia de RNA “sangue” que liga a proteína tesoura ao gene alvo.

Ao variar esses componentes, o sistema se torna uma caixa de ferramentas, com cada configuração adaptada para realizar um tipo específico de edição genética. Algumas proteínas Cas cortam ambas as cadeias de DNA; outros cortam rapidamente apenas um fio. Versões alternativas também podem cortar o RNA, um tipo de material genético encontrado em vírus, e podem ser usadas como ferramentas de diagnóstico ou tratamentos antivirais.

Diferentes versões de proteínas Cas são frequentemente encontradas através de pesquisas em ambientes naturais ou através de um processo chamado evolução direta. Aqui, o cientista troca racionalmente algumas partes da proteína Cas para aumentar potencialmente a eficácia.

É um processo muito demorado. É aí que entra a IA.

O aprendizado de máquina já ajudou prever efeitos fora do alvo em ferramentas CRISPR. É também hospedado em em proteínas Cas menores para facilitar a entrega de editores reduzidos nas células.

A Profluent usou a IA de uma maneira inovadora: em vez de impulsionar os sistemas atuais, eles projetaram componentes CRISPR do zero usando grandes modelos de linguagem.

Baseando-se no ChatGPT e no DALL-E, esses modelos lançaram a IA no mercado. Eles aprendem com grandes quantidades de texto, imagens, música e outros dados para destilar padrões e conceitos. É assim que os algoritmos geram imagens a partir de um único prompt de texto – digamos, “unicórnio com óculos de sol dançando sobre um arco-íris” – ou imitam o estilo musical de um determinado artista.

A mesma tecnologia também transformou o mundo do design de proteínas. Tal como as palavras num livro, as proteínas são encadeadas a partir de “letras” moleculares individuais em cadeias, que depois se dobram de formas específicas para fazer com que as proteínas funcionem. Ao alimentar a IA com sequências de proteínas, os cientistas já anticorpos formados e outro proteínas funcionais desconhecidas pela natureza.

“Grandes modelos de linguagem de proteínas generativas capturam o modelo subjacente do que torna uma proteína natural funcional”, escreveu a equipe na postagem do blog. “Eles prometem um atalho para contornar o processo aleatório de evolução e nos levar a projetar proteínas intencionalmente para um propósito específico.”

As IAs sonham com ovelhas CRISPR?

Todos os grandes modelos de linguagem precisam de dados de treinamento. O mesmo se aplica a um algoritmo que gera editores de genes. Ao contrário de textos, imagens ou vídeos que podem ser facilmente copiados online, um banco de dados CRISPR é mais difícil de encontrar.

A equipe primeiro examinou mais de 26 terabytes de dados sobre os sistemas CRISPR atuais e construiu um atlas CRISPR-Cas – o mais extenso até o momento, de acordo com os pesquisadores.

A pesquisa revelou milhões de componentes CRISPR-Cas. A equipe então treinou seus Modelo de linguagem ProGen2—que foi ajustado para descoberta de proteínas—usando o atlas CRISPR.

A IA acabou gerando quatro milhões de sequências de proteínas com atividade potencial de Cas. Depois de filtrar caloteiros óbvios com outro programa de computador, a equipe se concentrou em um novo universo de “tesouras de proteína” Cas.

O algoritmo não inventou apenas proteínas como Cas9. As proteínas Cas vêm em famílias, cada uma com suas peculiaridades na capacidade de edição de genes. A IA também projetou proteínas semelhantes ao Cas13, que tem como alvo o RNA, e ao Cas12a, que é mais compacto que o Cas9.

No geral, os resultados expandiram o universo de proteínas Cas potenciais quase cinco vezes. Mas algum deles funciona?

Olá, Mundo CRISPR

Para o próximo teste, a equipe se concentrou no Cas9, porque ele já é amplamente utilizado em áreas biomédicas e outras. Eles treinaram a IA em cerca de 240,000 mil estruturas proteicas Cas9 diferentes de vários tipos de animais, com o objetivo de gerar proteínas semelhantes para substituir as naturais – mas com maior eficácia ou precisão.

Os resultados iniciais foram surpreendentes: as sequências geradas, cerca de um milhão delas, eram totalmente diferentes das proteínas Cas9 naturais. Mas usando AlphaFold2 da DeepMind, uma IA de previsão de estrutura de proteínas, a equipe descobriu que as sequências de proteínas geradas poderiam adotar formas semelhantes.

As proteínas Cas não podem funcionar sem um guia de RNA de cão de caça. Com o atlas CRISPR-Cas, a equipe também treinou a IA para gerar um guia de RNA quando recebeu uma sequência de proteína.

O resultado é um editor de genes CRISPR com ambos os componentes – proteína Cas e guia de RNA – projetado pela IA. Apelidado de OpenCRISPR-1, sua atividade de edição genética foi semelhante aos sistemas clássicos CRISPR-Cas9 quando testada em cultura de células renais humanas. Surpreendentemente, a versão gerada por IA reduziu a edição fora do alvo em cerca de 95%.

Com alguns ajustes, o OpenCRISPR-1 também pode realizar edição de base, que pode alterar letras únicas do DNA. Em comparação com o CRISPR clássico, a edição de base é provavelmente mais precisa, pois limita os danos ao genoma. Nas células renais humanas, o OpenCRISPR-1 converteu de forma confiável uma letra de DNA em outra em três locais do genoma, com uma taxa de edição semelhante aos editores de base atuais.

Para ser claro, as ferramentas CRISPR geradas por IA só foram testadas em células em uma placa. Para que os tratamentos cheguem à clínica, terão de ser submetidos a testes cuidadosos de segurança e eficácia em seres vivos, o que pode levar muito tempo.

A Profluent está compartilhando abertamente o OpenCRISPR-1 com pesquisadores e grupos comerciais, mas mantendo internamente a IA que criou a ferramenta. “Lançamos publicamente o OpenCRISPR-1 para facilitar o uso amplo e ético em pesquisas e aplicações comerciais”, escreveram eles.

Como pré-impressão, o artigo que descreve seu trabalho ainda precisa ser analisado por revisores especializados. Os cientistas também terão que mostrar que o OpenCRISPR-1 ou variantes funcionam em vários organismos, incluindo plantas, ratos e humanos. Mas, de forma tentadora, os resultados abrem um novo caminho para a IA generativa – que poderá mudar fundamentalmente o nosso modelo genético.

Crédito de imagem: Profluente

local_img

Inteligência mais recente

local_img

Fale Conosco

Olá! Como posso ajudá-lo?