Генеративный анализ данных

Этот ИИ только что с нуля разработал более точный редактор генов CRISPR для человеческих клеток

Дата:

CRISPR произвел революцию в науке. Теперь ИИ выводит редактор генов на новый уровень.

Благодаря способности точно редактировать геном инструменты CRISPR сейчас широко используются в биотехнологиях и медицине для борьбы с наследственными заболеваниями. В конце 2023 года терапия с использованием Лауреат Нобелевской премии Инструмент получил одобрение FDA для лечения серповидноклеточной анемии. CRISPR также позволил CAR-Т-клеточная терапия для борьбы с раком и привык к снизить опасно высокий уровень холестерина в клинических испытаниях.

За пределами медицины инструменты CRISPR изменение сельскохозяйственного ландшафта, при этом проекты продолжаются безрогие быки, богатые питательными веществами помидорыи домашний скот и рыба с большей мышечной массой.

Несмотря на свое реальное влияние, CRISPR не идеален. Инструмент разрезает обе цепи ДНК, что может вызвать опасные мутации. Он также может непреднамеренно пресечь нежелательные участки генома и вызвать непредсказуемые побочные эффекты.

CRISPR был впервые обнаружен у бактерий как защитный механизм, что позволяет предположить, что природа скрывает множество компонентов CRISPR. За последнее десятилетие ученые исследовали различные природные среды — например, прудовую пену — чтобы найти другие версии инструмента, которые потенциально могли бы повысить его эффективность и точность. Несмотря на успех, эта стратегия зависит от того, что может предложить природа. Некоторые преимущества, такие как меньший размер или большая продолжительность жизни в организме, часто сопровождаются такими компромиссами, как меньшая активность или точность.

Вместо того, чтобы полагаться на эволюцию, можем ли мы ускорить улучшение инструментов CRISPR с помощью ИИ?

На этой неделе Текущий струей, стартап из Калифорнии, изложил стратегию которая использует ИИ для создания новой вселенной редакторов генов CRISPR. На основе больших языковых моделей — технологии, лежащей в основе популярного ChatGPT — ИИ разработал несколько новых компонентов для редактирования генов.

В клетках человека компоненты объединяются для надежного редактирования целевых генов. Эффективность соответствовала классическому CRISPR, но с гораздо большей точностью. Самый многообещающий редактор, получивший название OpenCRISPR-1, также может точно заменять отдельные буквы ДНК — технология, называемая базовым редактированием, — с точностью, не уступающей нынешним инструментам.

«Мы демонстрируем первое в мире успешное редактирование человеческого генома с помощью системы редактирования генов, где каждый компонент полностью разработан искусственным интеллектом», писал авторы в сообщении в блоге.

Брак, заключенный на небесах

У CRISPR и искусственного интеллекта давний роман.

Рецепт CRISPR состоит из двух основных частей: «ножничного» белка Cas, который разрезает или разрезает геном, и «ищейки» РНК-проводника, который привязывает ножничный белок к целевому гену.

Варьируя эти компоненты, система превращается в набор инструментов, каждая из которых приспособлена для выполнения определенного типа редактирования генов. Некоторые белки Cas разрезают обе нити ДНК; другие быстро отрезают только одну прядь. Альтернативные версии также могут разрезать РНК — тип генетического материала, обнаруженного в вирусах, — и могут использоваться в качестве диагностических инструментов или противовирусных методов лечения.

Различные версии белков Cas часто обнаруживаются в результате поиска в естественной среде или в ходе процесса, называемого прямой эволюцией. Здесь учёный рационально заменяет некоторые части белка Cas, чтобы потенциально повысить эффективность.

Это очень трудоемкий процесс. Вот тут-то и приходит на помощь ИИ.

Машинное обучение уже помогло прогнозировать нецелевые эффекты в инструментах CRISPR. Это также размещенный в на более мелких белках Cas, чтобы облегчить доставку уменьшенных редакторов в клетки.

Компания Profluent использовала ИИ по-новому: вместо того, чтобы улучшать существующие системы, они разработали компоненты CRISPR с нуля, используя большие языковые модели.

Эти модели, основанные на ChatGPT и DALL-E, сделали искусственный интеллект массовым явлением. Они учатся на огромных объемах текста, изображений, музыки и других данных, чтобы выделить закономерности и концепции. Именно так алгоритмы генерируют изображения из одной текстовой подсказки — скажем, «единорог в солнечных очках, танцующий над радугой» — или имитируют музыкальный стиль конкретного исполнителя.

Эта же технология также изменил мир дизайна белков. Подобно словам в книге, белки состоят из отдельных молекулярных «букв» в цепочки, которые затем складываются определенным образом, заставляя белки работать. Внеся белковые последовательности в ИИ, ученые уже искусственные антитела и другие функциональные белки, неизвестные природе.

«Большие модели генеративного белкового языка отражают основную схему того, что делает природный белок функциональным», писал команда в сообщении в блоге. «Они обещают кратчайший путь, который позволит обойти случайный процесс эволюции и подтолкнуть нас к намеренному созданию белков для конкретной цели».

Мечтают ли ИИ об овцах CRISPR?

Все большие языковые модели нуждаются в обучающих данных. То же самое справедливо и для алгоритма, генерирующего редакторы генов. В отличие от текста, изображений или видео, которые можно легко найти в Интернете, базу данных CRISPR найти труднее.

Команда сначала проверила более 26 терабайт данных о существующих системах CRISPR и создала атлас CRISPR-Cas — самый обширный на сегодняшний день, по словам исследователей.

Поиск выявил миллионы компонентов CRISPR-Cas. Затем команда обучила своих Языковая модель ProGen2— который был настроен для открытия белков — с использованием атласа CRISPR.

В конечном итоге ИИ сгенерировал четыре миллиона белковых последовательностей с потенциальной активностью Cas. Отфильтровав очевидных неплательщиков с помощью другой компьютерной программы, команда сосредоточилась на новой вселенной «белковых ножниц» Каса.

Алгоритм не просто придумал такие белки, как Cas9. Белки Cas делятся на семейства, каждое из которых имеет свои особенности в области редактирования генов. ИИ также разработал белки, напоминающие Cas13, нацеленные на РНК, и Cas12a, который более компактен, чем Cas9.

В целом, результаты расширили вселенную потенциальных Cas-белков почти в пять раз. Но работает ли кто-нибудь из них?

Привет, мир CRISPR

Для следующего теста команда сосредоточилась на Cas9, поскольку он уже широко используется в биомедицинских и других областях. Они обучили ИИ примерно на 240,000 9 различных белковых структур CasXNUMX от разных типов животных с целью создания аналогичных белков для замены природных, но с более высокой эффективностью и точностью.

Первоначальные результаты были неожиданными: сгенерированные последовательности, а их около миллиона, полностью отличались от природных белков Cas9. Но, используя AlphaFold2 от DeepMind, ИИ для предсказания структуры белка, команда обнаружила, что сгенерированные последовательности белков могут принимать схожие формы.

Белки Cas не могут функционировать без РНК-проводника ищейки. С помощью атласа CRISPR-Cas команда также обучила ИИ генерировать направляющую РНК при задании последовательности белка.

Результатом стал редактор генов CRISPR с обоими компонентами — белком Cas и РНК-проводником, — разработанный ИИ. Названный OpenCRISPR-1, его активность по редактированию генов была аналогична классической системе CRISPR-Cas9 при тестировании на культивируемых клетках почек человека. Удивительно, но версия, созданная искусственным интеллектом, сократила количество нецелевого редактирования примерно на 95 процентов.

С помощью нескольких настроек OpenCRISPR-1 также может выполнять базовое редактирование, что позволяет изменять отдельные буквы ДНК. По сравнению с классическим CRISPR редактирование базы, вероятно, является более точным, поскольку ограничивает повреждение генома. В клетках почек человека OpenCRISPR-1 надежно преобразовывал одну букву ДНК в другую в трех участках генома со скоростью редактирования, аналогичной нынешним базовым редакторам.

Чтобы внести ясность: инструменты CRISPR, созданные ИИ, тестировались только на клетках в чашке. Чтобы лекарства попали в клинику, им необходимо пройти тщательное тестирование на безопасность и эффективность на живых существах, что может занять много времени.

Profluent открыто делится OpenCRISPR-1 с исследователями и коммерческими группами, но оставляет ИИ, создавший этот инструмент, у себя. «Мы публикуем OpenCRISPR-1 публично, чтобы облегчить широкое и этичное использование в исследовательских и коммерческих приложениях», — написали они.

В качестве препринта статья, описывающая их работу, еще не проанализирована экспертами-рецензентами. Ученым также придется продемонстрировать, что OpenCRISPR-1 или его варианты работают на многих организмах, включая растения, мышей и людей. Но, как ни странно, результаты открывают новые возможности для генеративного искусственного интеллекта, которые могут фундаментально изменить нашу генетическую программу.

Изображение Фото: Текущий струей

Spot_img

Последняя разведка

Spot_img

Чат с нами

Всем привет! Могу я чем-нибудь помочь?