王军+陈义华NBT突破:用人工智能大规模挖掘人肠道菌群中的抗菌肽
热心肠小伙伴们 2022-03-04
中国科学院微生物研究所王军团队与陈义华团队合作在国际著名学术期刊Nature Biotechnology发表最新研究,建立了能从人肠道微生物组中大规模挖掘新型抗微生物肽的人工智能方法。我们特别附上对通讯作者王军教授的专访,以飨读者。

肠道微生物组是一座巨大的宝库,包含了海量的微生物基因。如何有效挖掘这座宝库,是微生物组研究中的热点问题。我们特别报道中国科学院微生物研究所王军团队与陈义华团队合作在国际著名学术期刊Nature Biotechnology最新发表的题为Identification of antimicrobial peptides from the human gut microbiome using deep learning的研究论文。该研究建立了能从人肠道微生物组中大规模挖掘新型抗微生物肽的人工智能方法我们特别附上对通讯作者王军教授的专访,以飨读者。

 

图片

王军

中国科学院微生物研究所研究员,博士生导师,国家高层次海外人才项目入选者,德国马普学会合作伙伴小组负责人,北京市科技新星。主要从事生物数据的深度挖掘和分析工作,利用统计学、生物信息学结合的方法,研究肠道菌群在动物和人类生态、基因组进化和疾病中的作用。至今,在ScienceNatureNature GeneticsNature Biotechnology等国际一流科技刊物发表SCI论文60余篇,承担重大基金项目5项,申请专利5项。

 

祝贺王老师团队在NBT发表重要成果!机器学习(尤其深度学习)是前沿也特别“酷”的一个领域。您和团队的这项研究采用了深度学习的方法挖掘肠道菌群的功能分子,是基于怎样的背景和出发点?

在与临床的一系列合作,尤其在自身免疫病菌群研究中,我们逐渐意识到肠道菌群除了代谢产生的一系列小分子以外,高度复杂的基因组也编码大量的多肽/小蛋白等大分子,能够作为模拟表位诱导自身免疫反应,或者作为免疫调节分子影响宿主的免疫。

微生物产生的小分子需要代谢组或者化学方法研究,但是大分子可以更直接地从大规模测序所积累的基因组数据中预测和进行功能实验。当然,这个过程的关键是建立准确的预测方法,降低假阳性所带来的实验成本。此外,具有同样功能的多肽可能在序列上没有显著的相似性,传统的生信方法作用有限

因此,我们转向自然语言分析中发展的神经网络模型,建立了高准确度的预测方法,并且在大量的宏基因组数据中以抗菌肽为第一个实例进行了挖掘

同时,我们有微生物所陈义华团队的大力支持,在所挖掘出的抗菌肽的结构和作用机制方向做了深入的工作。结果表明我们的方法没有局限于一类特定的抗菌肽,而是确实发现了很多序列、结构和机制都很新的抗菌肽。

目前用AI挖掘微生物组功能分子的研究现状如何?这项研究的主要亮点、创新点或突破何在?

现阶段,微生物组功能分子的挖掘集中于代谢组、生物化学分析上的小分子研究,整体的数据量和标准化程度对AI方法都有一定的限制,尤其是神经网络模型等方法更依赖于数据量,才能达到比较精准的判断。另一个方面,针对小分子的AI模型主要依赖于转化为图像分析的方法,基本不适用于基因组编码的生物大分子

这项研究的特点有四个:

首先,我们的研究思路是,从序列数据出发直接挖掘具有功能的生物大分子,并应用于生物大数据的转化以及最终的临床治疗,可被看作新的“从硬盘到药物”的研究范式。

同时,我们应用的深度学习神经网络模型来源于自然语言学习,更适合分析基因组数据、蛋白数据等文本信息,区别于之前医学影像分析、小分子学习的图像分析方法。

再者,可挖掘的分子空间非常巨大,对于特定长度的DNA和蛋白,其分子理论多样性堪比天文数字级别,即使具有特定功能的分子比例极低,仍然会有大量高活性的大分子。

最后,我们的工作不仅实现了高通量筛选和验证,还寻找到了可用于动物体内实验的候选分子,将药物前期筛选的流程极大压缩,对降低药物筛选、设计的成本和时间具有积极作用。

这项研究有哪些后续规划?在转化应用方面有什么考虑?

我们正在对于现有活性好、安全性高的抗菌肽进行化学改性,进一步提高药代性能。我们也希望感兴趣的生物医药公司和我们合作公关,开发用于耐药菌治疗的新型抗菌药物。

利用同样的流程,我们还发现了具有调节免疫或者改善代谢功能的多肽,正在做机制研究和动物实验。

发掘其他类型的生物分子例如RNA,进一步延伸到设计分子,一系列工作都在紧锣密鼓地进行中。这些工作也具有可观的转化价值,我们也希望能与生物医药产业开展更多合作研发与转化。

在2021中国肠道大会开幕式报告中,您系统讲解了数据和方法驱动的微生物组研究的现状和未来(点此查看),那么AI对肠道微生物组研究和功能分子挖掘的应用和前景如何呢?

除了挖掘生物大分子,在更多微生物组数据和表型的基础上,AI方法的进步与应用可以实现多个层面的研究质变。它可以挖掘与疾病相关的微生物类群、基因、通路或毒力因子,结合代谢组学数据发现新的代谢通路、催化途径,结合合成生物学设计新的通路,以及更高效协助疾病的诊断、预测、干预或治疗,但仍然需要依赖大量标准化数据的积累和方法学进步。

可否介绍一下您课题组的其他研究方向?

人工智能挖掘功能分子是我们研究组下游方向的代表性工作。

上游,研究组主要利用新的测序技术,尤其牛津纳米孔技术(ONT)进行微生物组学分析的新方法研究,例如利用ONT建立了针对病原组学的快速分析方法(mtTGS,发表于2021年Advanced Science),以及之前研究较少的微生物组学的分支病毒组学(virome,2021年Gut Microbes)、真菌组学(Molecular Ecology,minor revision)等。

中游,我们和临床机构开展了一系列合作,在自身免疫性疾病例如系统性红斑狼疮(发表于Arthritis & Rheumatology 2021年封面)、类风湿关节炎、代谢性疾病的中医治疗(GBP 2020),以及对多种肿瘤深入阐述微生物组的作用和分子机制。

能否分享一下您的求学和科研经验?给博士/博士后提供一些做好科研的建议?

我于2008年本科毕业于中国海洋大学生物技术专业、国家生命科学基地班,而后在比利时根特、西班牙奥维耶多、德国不来梅大学三个学校完成了欧盟Erasmus Mundus硕士项目。2010年进入德国马普进化生物所做博士研究,主要利用野生家鼠模型研究肠道菌群的地缘生物学(2013年,Molecular Ecology)、遗传学(2014年,PNAS)和进化(2015年,Nature Communications),2014年以最高成绩毕业。随后进入比利时鲁文大学、弗拉芒生物研究所,主要从事大人群的肠道菌群分析和基因关联研究。2016年,先后发表Science封面和Nature Genetics封面文章。2017年回国后在中科院微生物所,在中科院病原微生物与免疫重点实验室建立课题组。

我的硕士、博士和博后科研经历得益于德国马普所、鲁汶大学等科研机构的宽松科研环境和氛围,对自由探索相对宽容,并鼓励新的思路和方法。我建议正在进行科研的基础训练的博士和博士后,主动学习新的知识,了解领域的发展方向,积极开拓新的研究领域,不局限于自身的擅长部分,而是要更加主动去挑战不擅长、融入新研究

 

(专访内容结束)

专家简介
王军
中国科学院微生物研究所研究员
中国肠道大会联合发起人
中国科学院微生物研究所研究员,博士生导师,国家高层次海外人才项目入选者,德国马普学会合作伙伴小组负责人,北京市科技新星,北京市自然基金委杰出青年项目获得者,中源协和生命医学创新突破奖获得者(2022),中科院优秀导师(2022、23)。主要进行生物数据的深度挖掘和分析工作,工作中利用生物信息学、人工智能和新测序方法结合的方法,研究肠道菌群在动物和人类生态、基因组进化和疾病中的作用,以及实现其在疾病治疗中的转化。至今,在Nature Biotechnology、Science,Nature,Nature Genetics等国际一流科技刊物上发表SCI论文70余篇,承担重大基金项目8项,申请专利6项。
了解更多
相关推荐
评论
热门分类