将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯


编辑丨&

蛋白质是生命中的分子机器,在能源、健康甚至于像是洗衣粉这类日常消费品中都有着广泛的应用。但即使如此,为了实际应用而对蛋白质进行工程改造,仍然处于极度缓慢、昂贵且技术门槛高的尴尬局面。

美国伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)提出了一个通用的自主酶工程平台,集成了大型语言模型与生物制造自动化,为医药、生物技术等多个行业带来了快速进步的新范式。

该研究以「A generalized platform for artificial intelligence-powered autonomous enzyme engineering」为题,于 2025 年 7 月 1 日刊登在《Nature Communications》。

论文链接:https://www.nature.com/articles/s41467-025-61209-y

自主工程平台

传统的实验室效率取决于实验人员的经验高低,而手动实验任务更是劳心劳力,也容易出现可重复性问题,难以扩展,并且在处理大量数据集和高通量实验时会变得越来越复杂。

而 AI 驱动的系统可以比传统计算技术更有效地探索庞大的多维空间,而机器人技术和自动化则可以更快、更可靠地执行实验,具有更好的可扩展性和更高的通量。

在生物学中,自主实验尚不成熟,许多自主实验平台都处在起步阶段,通用平台的扩展性与适应性让其成为优先发展的目标。本次研究的实验团队就希望以蛋白质工程为例,推动合成生物学的创新。

在本次实验中,团队以酶为主要研究方向,通过迭代的设计、构建、测试和学习(DBTL)循环,酶可以变得更加稳定、选择性更强或效率更高。

图 1:自主蛋白质工程通用平台的概述。(来源:论文)

团队介绍了一个由伊利诺伊生物制造工厂(iBioFAB)、机器学习(ML)和大型语言模型(LLMs)支持的通用自主酶工程平台。由于该平台只需要蛋白质序列和量化适应度数据,因此它可以应用于广泛的蛋白质。

作为概念验证,实验者分别将拟南芥卤化物甲基转移酶(AtHMT)和鼠疫耶尔森菌植酸酶(YmPhytase)的变体工程化,在 4 周内重复了 4 轮工程,处理后的活性分别比野生型酶高约 16 倍和 26 倍,每种酶仅需构建和表征不到 500 个变体

实验设计与新见解

在基于机器学习的蛋白质工程中,通过定点突变(SDM)生成的突变体的测序与验证往往会导致流程延迟。故而,团队设计了一种以 HiFi 组装为基础的突变方法,消除过程中途进行序列验证的需要,实现不间断的工作流程。

图 2:自动化蛋白质工程工作流。(来源:论文)

模块内的实验步骤完全自动化,几乎不需要人工干预。每个模块都单独编程到 iBioFAB 平台上,并仔细优化。工作流自动化了所有蛋白质工程步骤,包括突变 PCR、DNA 组装等。

以两种不同的酶——AtHMT 和 YmPhytase 为例,团队展示了平台的通用性。

59.6%的 AtHMT 变体和 55%的 YmPhytase 变体在性能上超过了野生型基线,其中 50%和 23%的变体分别表现得更为显著。无监督模型预测的最佳突变体分别是 AtHMT 的 V140T,性能提高了 2.1 倍,以及 YmPhytase 的 V141M,性能提高了 2.6 倍。

在验证中,团队观察到一个有趣的现象:ML 驱动的实验往往会产生令人惊讶的结果和意想不到的方向。

尽管 S99T/V140T 是第二轮中最好的双突变体,但含有 S99T/V140T 的三重突变体中没有一个进入前 100 名。于是团队对此进行了实验验证,试图找出 ML 模型是否能够识别突变之间的协同效应。

图 3:AI 驱动的自主工程化 AtHMT 和 YmPhytase 酶的结果。(来源:论文)

在 AtHMT 改造中,人类直觉倾向于组合已知高活性突变,但 AI 预测的非直觉组合活性更优 ——82% 的 AI 预测 triple 突变体呈现出更好的活性,占比也远高出第二轮突变体的 11%。

实验观察到,目标变体的活性在整个四个工程周期中都有所增加,且适应度都优于野生型。

对于 AtHMT,每一轮表现最好的变体在粗裂解物测定中分别比 wtHMT 好 2.1 倍、3 倍、4.3 倍和 5.1 倍;对于 YmPhytase,每一轮表现最好的变体在粗裂解物测定中分别比 wtPhy 好 2.6 倍、7.5 倍、9 倍和 11.1 倍。

值得一提的是,有两种 AtHMT 变体,前者在乙基转移酶活性方面比 wtHMT 提高了约 16 倍,后者对乙基碘化物的偏好比对甲基碘化物的偏好提高了约 90 倍。

这些夸张的数据无不表明了这种自主方法的工程应用价值。

小结

「对于用户界面,我们的动机是让不同背景的人能够使用这个工具。」论文的共同作者 Tianhao Yu 表示。

研发团队开发了一个基于自然语言的用户界面,以协助没有编程技能的用户与蛋白质工程平台进行交互。利用 OpenAI 的助手 API 和自定义功能,小白也可以用简单的命令设计初始库。

这个平台的意义并不只在于其对实验效率的提升,而是透过酶工程表示了自主实验平台的发展潜力。

平台仍存在一些局限,譬如并非适用于所有蛋白质等。但随着未来技术更深入的探索,自主实验平台也会集成更多有力的模块,待到那时,一个完整泛用的框架将会是整个工程试验的坚实基础。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。