生物活性肽的 "智能导航仪": AI 如何破解研发痛点?

2026-02-06 13:57
4
生物活性肽的 "智能导航仪"
AI 如何破解研发痛点?

图片: Ella Marushchenko


在健康科技与生物工程的交叉领域,生物活性肽正成为解锁天然健康密码的关键。这些由氨基酸链组成的小分子,兼具抗菌、抗氧化、抗炎等多样生物功能,广泛存在于牛奶、大豆、鳄鱼肉等各类食物中,甚至隐藏在难以获取的宏基因组样本里。然而,传统发现方法依赖多步分离纯化,耗时耗力且资源消耗巨大,严重制约了其产业化进程。如今,人工智能(AI)的介入正彻底改变这一格局,让生物活性肽的高效筛选与精准设计成为现实。


01
传统发现困境:耗时耗力的 "大海捞针"


生物活性肽的传统发现流程堪称一场漫长的 "征途"。从蛋白质酶解、超滤,到离子交换层析、反相高效液相色谱,每一步分离纯化都需要精密操作,不仅消耗大量实验室资源,还可能导致目标肽段流失。即便最终通过液质联用技术鉴定出序列,整个过程也可能耗时数月甚至数年。更棘手的是,自然界中生物活性肽来源分散、功能多样,仅 BIOPEP-UWM 数据库就收录了超过 5000 种,传统方法难以实现规模化筛选,许多具有潜在价值的肽段始终 "藏在深闺人未识"。


02

AI 破局:六步流程实现高效发现


AI 技术的出现,为生物活性肽发现搭建了全新的数字化平台。其核心流程包含六个关键步骤:先通过数据库挖掘与文献整理收集海量数据,经去重标注后构建高质量数据集;再将肽段的序列、结构等生物特征转化为机器可识别的物理化学描述符,如今更有预训练蛋白质语言模型(如 ESM、ProtBERT)能自动学习肽段核心特征;随后构建分类或回归模型,通过随机森林、卷积神经网络(CNN)、Transformer 等算法进行训练优化;最后经交叉验证后,即可实现高通量预测与新肽段筛选。

这套流程不仅将发现周期从数年缩短至数周,还能突破传统方法的局限。例如,DeepMAMP 模型通过 LightGBM、LSTM 与注意力机制的结合,成功从母乳中预测出 322 种抗菌肽;Macrel 工具则直接从基因组数据中挖掘抗菌肽,助力科研人员从 6 万多个宏基因组中筛选出近百万个候选肽段。在抗氧化肽领域,AnOxPP 模型凭借双向长短期记忆网络(BiLSTM),实现了 96.7% 的预测准确率,远超传统实验筛选效率。

AI 驱动的生物活性肽研究主要分为预测模型与从头设计两类。预测模型通过分类或回归解决 "是什么" 和 "活性有多强" 的问题,而从头设计则通过生成对抗网络(GANs)、变分自编码器(VAEs)等模型创造全新肽段。现代生成模型更将生成与预测步骤深度融合,借助强化学习优化肽段的效价、稳定性与低毒性等多重属性。


03
四大核心应用:AI 赋能多元肽类研发


抗菌肽
对抗耐药菌的新武器
01


面对日益严峻的抗生素耐药性问题,AI 驱动的抗菌肽研发提供了新解法。抗菌肽(AMP)长度多在 10-100 个氨基酸之间,可通过靶向细胞壁、细胞膜或细胞内成分发挥作用,其机制包括桶状孔道模型、地毯模型等多种方式。

专用数据库的建设为 AI 研发奠定了基础,APD3 收录 5099 种抗菌肽,dbAMP 则涵盖 33065 种抗菌肽及 2453 种抗菌蛋白。基于这些数据,AMPlify 模型成功从牛蛙基因组中发现针对 WHO 优先级病原体的抗菌肽;AMPGenix 模型以 ProteoGPT 为基础,生成 7798 种肽段,经验证后 3 种具有广谱抗菌活性,且耐药性诱导风险更低。Macrel 工具更实现了从基因组数据直接挖掘,助力 AMPSphere 项目从海量宏基因组中筛选出近百万个抗菌肽候选物。


抗氧化肽
天然抗衰的 "隐形卫士"
02


氧化应激与糖尿病、癌症、衰老等多种问题相关,抗氧化肽(AOP)通过三大机制发挥作用:直接中和活性氧(ROS)、螯合 Fe²⁺等金属离子阻止羟基自由基生成、调控抗氧化酶表达。AODB 数据库收录了 1480 种抗氧化肽及 56666 种抗氧化小分子,为 AI 研究提供了数据支撑。

AI 模型在抗氧化肽研发中表现亮眼:AnOxPePred 通过 CNN 模型区分自由基清除剂与金属螯合剂,AOPxSVM 经特征工程优化后准确率达 93.33%。科研人员通过生成模型与密度泛函理论(DFT)结合,设计出 6 种抗氧化活性媲美维生素 C 的肽段;借助 AI 技术,从棉籽蛋白、米糠、鱿鱼皮等原料中也成功筛选出高活性抗氧化肽。


抗炎肽
精准调控免疫反应
03


炎症反应涉及 NF-κB、MAPK 等复杂信号通路,过度炎症会引发多种疾病。抗炎肽(AIP)通过抑制受体结合、阻断激酶磷酸化等机制调控这些通路,部分肽段还兼具抗菌或抗氧化功能。

AI 预测工具不断升级,从早期的 antiInflam 到采用预训练蛋白质语言模型的 DeepAIP,预测准确率持续提升。DeepAIP 曾从非训练集中成功识别出 17 种已验证的抗炎肽,验证了其泛化能力。这些工具多以 IEDB 数据库为数据来源,该数据库收录了能触发抗炎细胞因子的实验验证表位,为模型训练提供了可靠基础。


多功能肽
一站式解决复杂健康需求
04


超过 67% 的蛋白质具有多结构域,而肽段同样可具备多功能性 —— 既可能本身拥有多种作用机制,也可能在特定场景下展现附加功能。例如 Temporin G 兼具抗菌与抗病毒活性,部分抗氧化肽在感染模型中可发挥抗炎作用。



AI 技术为多功能肽研发提供了高效手段:MMDB 模型通过多模态数据融合与双分支结构,实现 73.3% 的多功能预测准确率;DLFea4AMPGen 整合深度学习特征,从头设计的抗菌肽活性可媲美万古霉素等经典药物。研究多聚焦于协同功能组合,如抗菌 - 抗氧化 - 抗炎三联功能,或通过融合细胞穿透肽(CPP)提升靶向性。


04
其他潜力肽类:AI 拓展研发边界


图片:Pexels-tara winstead


除四大核心类别外,AI 还助力多种特色生物活性肽的发现。降压肽(AHP)通过调控肾素 - 血管紧张素系统发挥作用,梯度提升决策树(GBDT)已用于其筛选;抗焦虑肽、抗癌肽、抗衰老肽等也成为研究热点,LLM 模型更被用于优化消化酶组合,提升肽类产量。这一趋势表明,AI 驱动的肽类研发正从单一功能向系统级解决方案拓展,覆盖更多复杂疾病场景。


05
未来展望:定制化肽类离我们越来越近


随着技术迭代,AI 在生物活性肽领域的应用将更加深入。未来,场景化定制将成为核心方向 —— 例如为炎症性肠病患者设计兼具抗氧化与抗炎功能的肽类药物,或针对特定病原体定制高特异性抗菌肽。通过模拟蛋白质消化过程,AI 还能精准预测食物在体内释放的生物活性肽,指导功能性食品研发。

当前,数据库质量与机制研究仍是关键瓶颈,数据稀疏、标注不一致可能导致模型过拟合。未来需加强数据库标准化建设,结合机制导向分类提升预测精度;同时发展可解释 AI(XAI)技术,打破 "黑箱" 预测,深化对肽类功能机制的理解。

从传统实验的 "大海捞针" 到 AI 时代的 "精准导航",生物活性肽的发现正经历效率革命。随着数据质量提升与算法优化,这些自然界的 "微小宝藏" 将在医药、食品、美妆等领域发挥更大价值,为人类健康带来更多天然解决方案。这场由科技驱动的生物革命,正在悄悄改变我们与健康的相处方式。


参考文献:

Xu Liu, Feifei Guan, Huiying Luo, Bin Yao, Jian Tian,

Artificial intelligence-driven discovery of bioactive peptides: Computational approaches and future perspectives,

aBIOTECH,

Volume 7, Issue 1,   2026, 100014, ISSN 2662-1738,

https://doi.org/10.1016/j.abiote.2025.100014.

关于日泰

上海日泰成立于1999年,是国内领先的生物反应器制造商。我们专注于细胞与微生物工艺的规模放大,将智能技术与生物工艺深度融合,实现从设计制造、安装调试到售后培训的全流程智慧化管理。依托智能系统与数据驱动,我们确保每一环节均符合GMP标准,并提供高效可靠的验证支持。日泰致力于以智能创新赋能生物技术,为生物制药行业提供更智能、更高质量的整体解决方案。







333355003.JPG
上海日泰医药设备工程有限公司
地址:上海市青浦区香花桥街道新金路39号
电话:021-59229777