生成数据智能

这个人工智能刚刚从头开始为人类细胞设计了一个更精确的 CRISPR 基因编辑器

日期:

CRISPR 彻底改变了科学。人工智能现在正在将基因编辑器提升到一个新的水平。

由于其能够准确编辑基因组,CRISPR 工具现已广泛应用于生物技术和医学领域,以解决遗传性疾病。 2023 年末,一种使用 诺贝尔奖获得者 该工具获得 FDA 批准用于治疗镰状细胞病。 CRISPR 还启用了 CAR T 细胞疗法对抗癌症 并已习惯 降低危险的高胆固醇水平 在临床试验中。

在医学之外,CRISPR 工具是 改变农业景观,项目正在进行中 无角公牛, 营养丰富的西红柿牲畜和鱼类 具有更多的肌肉质量。

尽管 CRISPR 对现实世界产生了影响,但它并不完美。该工具会剪断两条 DNA 链,这可能会导致危险的突变。它还可能无意中夹住基因组的非预期区域并引发不可预测的副作用。

CRISPR 最初作为一种防御机制在细菌中被发现,这表明自然界隐藏着大量的 CRISPR 成分。在过去的十年中,科学家们筛选了不同的自然环境(例如池塘浮渣),以找到可以提高其功效和精度的其他版本的工具。虽然这种策略很成功,但它取决于大自然的条件。一些好处,例如更小的尺寸或更长的体内寿命,通常会伴随着较低的活动或精度等权衡。

我们能否通过人工智能快速开发出更好的 CRISPR 工具,而不是依赖进化?

这一周, 富裕,一家位于加利福尼亚州的初创公司, 制定了战略 使用 AI 构想 CRISPR 基因编辑的新世界。基于大型语言模型(流行的 ChatGPT 背后的技术),人工智能设计了几种新的基因编辑组件。

在人类细胞中,这些成分相互结合以可靠地编辑目标基因。效率与经典 CRISPR 相当,但精度更高。最有前途的编辑器被称为 OpenCRISPR-1,它还可以精确地替换单个 DNA 字母(一种称为碱基编辑的技术),其准确性可与当前工具相媲美。

“我们展示了世界上首次使用基因编辑系统成功编辑人类基因组,其中每个组件都是完全由人工智能设计的,” 作者在博客文章中。

天作之合

CRISPR 和 AI 的恋情由来已久。

CRISPR配方有两个主要部分:用于切割或切割基因组的“剪刀”Cas蛋白,以及将剪刀蛋白与目标基因连接的“猎犬”RNA向导。

通过改变这些组件,系统变成了一个工具箱,每个设置都经过定制以执行特定类型的基因编辑。一些 Cas 蛋白会切割 DNA 的两条链;其他人只快速剪断一根头发。替代版本还可以切割 RNA(病毒中发现的一种遗传物质),并可用作诊断工具或抗病毒治疗。

不同版本的 Cas 蛋白通常是通过搜索自然环境或通过称为直接进化的过程来发现的。在这里,科学家合理地替换了 Cas 蛋白的某些部分,以潜在地提高功效。

这是一个非常耗时的过程。这就是人工智能发挥作用的地方。

机器学习已经有所帮助 预测脱靶效应 在 CRISPR 工具中。这也是 归巢 更小的 Cas 蛋白,使小型编辑器更容易递送到细胞中。

Profluence 以一种新颖的方式使用人工智能:他们没有增强现有系统,而是使用大型语言模型从头开始设计 CRISPR 组件。

这些模型以 ChatGPT 和 DALL-E 为基础,将 AI 推向了主流。他们从大量文本、图像、音乐和其他数据中学习,提炼出模式和概念。这就是算法如何根据单个文本提示(例如,“戴着墨镜的独角兽在彩虹上跳舞”)生成图像,或者模仿特定艺术家的音乐风格。

同样的技术也 改变了蛋白质设计世界。就像书中的文字一样,蛋白质由单个分子“字母”串成链,然后以特定方式折叠以使蛋白质发挥作用。通过将蛋白质序列输入人工智能,科学家们已经 形成的抗体 和别的 自然界未知的功能蛋白.

“大型生成蛋白质语言模型捕捉了天然蛋白质功能的基本蓝图,” 博客文章中的团队。 “他们承诺提供一条绕过随机进化过程的捷径,推动我们为特定目的有意设计蛋白质。”

人工智能会梦见 CRISPR 羊吗?

所有大型语言模型都需要训练数据。对于生成基因编辑器的算法也是如此。与可以轻松在线抓取的文本、图像或视频不同,CRISPR 数据库更难找到。

研究人员表示,该团队首先筛选了超过 26 TB 的有关当前 CRISPR 系统的数据,并构建了迄今为止最广泛的 CRISPR-Cas 图集。

搜索揭示了数百万个 CRISPR-Cas 组件。随后,该团队对他们进行了训练 ProGen2 语言模型——使用 CRISPR 图集对蛋白质发现进行了微调。

AI 最终生成了 400 万个具有潜在 Cas 活性的蛋白质序列。在用另一个计算机程序过滤掉明显的无赖后,该团队将注意力集中在 Cas“蛋白质剪刀”的新宇宙上。

该算法不仅仅是想象出像 Cas9 这样的蛋白质。 Cas 蛋白分为多个家族,每个家族在基因编辑能力方面都有自己的特点。 AI 还设计了类似于 Cas13(靶向 RNA)和 Cas12a(比 Cas9 更紧凑)的蛋白质。

总体而言,这些结果将潜在 Cas 蛋白的范围扩大了近五倍。但它们中的任何一个有效吗?

你好,CRISPR 世界

在接下来的测试中,团队将重点放在Cas9上,因为它已经广泛应用于生物医学和其他领域。他们对来自多种动物的大约 240,000 种不同的 Cas9 蛋白质结构进行了训练,目标是生成类似的蛋白质来替代天然蛋白质,但效率或精度更高。

最初的结果令人惊讶:生成的序列(大约一百万个)与天然 Cas9 蛋白完全不同。但使用 DeepMind 的 AlphaFold2(一种蛋白质结构预测人工智能),该团队发现生成的蛋白质序列可以采用相似的形状。

如果没有猎犬 RNA 引导,Cas 蛋白就无法发挥作用。通过 CRISPR-Cas 图谱,该团队还训练人工智能在给定蛋白质序列时生成 RNA 向导。

结果是由 AI 设计的 CRISPR 基因编辑器,包含 Cas 蛋白和 RNA 向导这两个组件。在培养的人肾细胞中进行测试时,其基因编辑活性被称为 OpenCRISPR-1,与经典的 CRISPR-Cas9 系统相似。令人惊讶的是,人工智能生成的版本将脱靶编辑减少了大约 95%。

经过一些调整,OpenCRISPR-1 还可以执行碱基编辑,这可以改变单个 DNA 字母。与经典的 CRISPR 相比,碱基编辑可能更精确,因为它限制了对基因组的损害。在人类肾细胞中,OpenCRISPR-1 在基因组的三个位点可靠地将一个 DNA 字母转换为另一个 DNA 字母,其编辑率与当前的碱基编辑器相似。

需要明确的是,人工智能生成的 CRISPR 工具仅在培养皿中的细胞中进行了测试。为了让治疗方法进入临床,需要在生物体中进行仔细的安全性和有效性测试,这可能需要很长时间。

Profluence 正在与研究人员和商业团体公开共享 OpenCRISPR-1,但将创建该工具的人工智能保留在内部。他们写道:“我们公开发布 OpenCRISPR-1,以促进研究和商业应用中广泛、合乎道德的使用。”

作为预印本,描述他们工作的论文尚未经过专家同行评审员的分析。科学家还必须证明 OpenCRISPR-1 或变体在多种生物体中发挥作用,包括植物、小鼠和人类。但令人着迷的是,这些结果为生成人工智能开辟了一条新途径——可能从根本上改变我们的基因蓝图。

图片来源: 富裕

现货图片

最新情报

现货图片

在线答疑

你好呀! 我怎么帮你?