各位老师好,首先感谢热心肠研究院的邀请,我叫贺子龙,来自于北京航空航天大学医学科学与工程学院,我今天演讲的题目是《基于泛基因组框架的人体微生物菌群结构解析》。
我将结合既往的一些研究工作,与各位老师共同探讨人体微生物菌群的研究思路。
近些年来微生物组学研究火热,特别是肠道微生物组学。
目前已有诸多报道证实肠道菌群与疾病,如癌症、心血管病、精神疾病有很多联系,肠道也被认为是人体最大的免疫器官。
除肠道外,人体其他部位如口腔、皮肤、肺部等也存在微生物菌群。相关研究相继展开,国内外也相继启动了大型的人体微生物组学研究。
我们的团队主要基于生物信息学方法研究人体微生物组学,主要的研究方向有两个:
一是,基于宏基因组等多组学方式研究人体微生物与疾病之间的联系;
二是,基于单菌株的比较基因组、泛基因组的人体病原微生物检测,主要依托于二代测序、三代测序或两者的结合。
多组学方式研究人体微生物与疾病关联
基于这些技术,我们也与合作老师共同完成了一些人体微生物组学的研究,如头皮微生物、尿路微生物、肠道微生物和肺部微生物等。
早期我们利用三代测序对临床病原菌,如肺炎克雷伯菌的基因组进行了解析,挖掘出一些比较特殊的抗性基因,如抗金属离子。
除此之外,我们还从人体中分离出一株特殊的病原菌。通过比较基因组学发现,该菌株与植物病原菌的基因簇高度相似。基于该提示,我们将该菌株与植物进行侵染,研究发现该菌株是个可以同时感染人体和植物的特殊菌株。
在头皮微生物方面,我们分析了中国健康人群、头皮屑人群的微生物组成差异,重点关注了细菌和真菌的研究,并将细菌和真菌的网络进行整合分析。
比较有意思的是,前期报道对头皮有害的马拉色菌,我们的研究发现其个别亚群对头皮的贡献是有益的。
在尿路微生物方面,肾结石患者往往伴随着较严重的尿路感染。我们通过收集这类患者的尿液进行尿路微生物的数据测序和分析发现,该类患者存在两种新的临床亚型,而且两个新亚型在白细胞水平上存在明显差异。后期的深入研究还发现,两个临床亚型由不同细菌的门、菌株进行主导。
该研究为尿路感染分析提供了新的思路。
除人体微生物组方向,我们还利用16S测序对医院环境进行监控,研究目的为了解医院感染与环境微生物之间的关系。
我们针对某医院的重症监护室(ICU)进行了为期一年的连续取样,取样位置包含ICU的地面、床单、仪器以及医生和护士的手,并将这些样品与常规的细菌培养进行比较。
经研究发现,16S测序可以完成医院感染的监控,我们的分析还发现环境微生物的变化呈现出周期性态势。这可能提示我们,医院ICU的环境微生物可能与温度或湿度有关。
我们开发了一些生物信息的分析流程,如肠道微生物等多组学的分析流程。该流程可以整合肠道宏基因组、代谢组等,得出菌群、代谢物以及代谢通路三者之间的关系。
与此同时,我们开发出宏基因组二代测序(mNGS)的病原微生物分析流程;利用泛基因组思路,我们开发了菌株特异的参考数据集,该数据集的灵敏性优于网上的公共数据;我们也把耐药基因检测加入到mNGS的分析流程中。
人体微生物组学研究设想
之前的人体微生物组学研究丰富了我们经验的同时,也引发了我们一些思考,如肠道菌群含量丰富,研究思路广泛,研究方法多样。但除肠道微生物之外,其他人体部位的微生物组研究主要是以感染性疾病为主,研究思路相对单一。
在此,我们提出了两个问题:
第一,除肠道之外,人体微生物菌群是否也参与了非感染性疾病的发生与发展?
第二,部分菌种对于疾病的影响说法不一,抛去计算偏差的考量,种群内部的功能性差异是否有必要在今后的数据分析中进行考量?
总的来说,人体微生物组需要在种群和功能上进行深入研究。
利用泛基因组研究人体微生物
如何进行深入研究,特别是从生物信息学角度来讲,我们认为人体微生物组学应该大力发展泛基因组研究。
相对于宏基因组,泛基因组的概念可能相对陌生。
那么什么是泛基因组学?2005年在细菌研究中首次提出的泛基因组学,是指物种内所有基因的信息总和,一般将基因分成核心基因、非必需基因。核心基因是指种群内95%菌株都含有的基因,其余称为非核心基因。
泛基因组主要研究核心基因和非核心基因的组成,以及基因的流动。目前,泛基因组研究主要在动植物的群体研究中非常火热。
泛基因组学研究,主要能为人体微生物研究带来如下几点收获。
泛基因组可以描述物种内生物功能的总体情况
微生物,尤其是细菌存在很多的基因水平转移事件,这些可移动基因可能来自于亲缘关系较远的物种。因此对于该物种,少量的基因测序很难描述物种的基因总和。在菌株达到一定数量的情况下,运用泛基因组策略可以很好地描述物种内基因的总体情况。
泛基因组可以解析物种内基因的流动性
正如前面所言,细菌中有很多基因水平转移,其微生物的流动性较强,泛基因组可以通过核心基因、非必需基因描述物种内基因的流动性。
泛基因组可以反映微生物与宿主的互相作用
假设肠道内不同肠段,如大肠、小肠、盲肠以及粪便都含有大肠杆菌,因为这些菌群所处的微环境不同,不同大肠杆菌菌群的核心基因和非核心基因也有所差异。利用泛基因组策略,可以在一定程度上描述微生物和宿主之间的互相作用。
泛基因组学有助于开发菌种特异分子标记
如何利用泛基因组学研究人体微生物组?我个人认为有两个层次:
第一,从菌株层面来讲,利用普通的微生物培养或近年比较火的培养组学挖掘更多的菌株,进行全基因组测序,并利用泛基因组策略对物种进行功能和结构上的挖掘;
第二,从海量的宏基因组数据等多组学数据角度出发,利用组装和分箱策略,挖掘样品中的单一菌株信息,构建宏基因组中的泛基因组框架。
当然,也可以把这两个层次进行整合分析。
首先从菌株层次上,我们先后构建了大肠杆菌、肉毒杆菌以及金黄色葡萄菌球菌的泛基因组框架。
在大肠杆菌的研究中,我们先后收集了来自世界各地的不同菌株,通过泛基因组分析发现:大肠杆菌存在两个常见的亚群,这两个亚群对于糖和蛋白质的需求不同。这可能说明,两个亚群在核心基因和非必需基因上存在功能性差异。
在肉毒杆菌和金黄色葡萄球菌的研究中,我们通过网上的海量数据分别构建了菌种特异的通用型分子标记,对感染事件和中毒事件进行溯源,为防控疫情的爆发和寻找源头的研究提供了有力支持。
与此同时,我们将新开发的这些分子标记与传统分子标记进行比较。
研究发现,新的分子标记在种群内的基因频率明显优于传统分子标记。在菌株的聚类层面上,新的分子标记也与传统分子标记有所不同。
研究同时,我们也与合作者开发了一些生信软件,如Evolview在线进化树注释工具,可通过提交进化树的原始文件,对进化树完成各种生物学注释。
除此之外,我们还开发了基于kmer以及机器学习方法的质粒预测工具。
我们知道,对于二代测序而言,质粒预测十分困难。经比较发现,我们的新软件与同类型软件相比,准确性是最高的。
在宏基因组研究层面,我们目前主要关注药物干预对于肠道菌群结构的影响,重点挖掘肠道中的一些药物酶。
我们发现,一些在肝脏表达活跃的酶,在肠道菌群中含有相似的同源基因。通过三维结构和功能元件的比较,挖掘出了一些功能相同的酶和菌群。结合泛基因组学的经验,我们将这些含有相同酶的菌群进行了统一考量,而非单纯地以种群为单位进行研究。
目前该研究已进入试验验证阶段,我们相信该研究可以为药物代谢提供新的思路。
最后,总结一下我们团队的长期目标:
首先是构建人体,例如肠道、肺部、尿路、血液、胆汁等各个组织的微生物图谱。除常规的基因数据、宏基因组数据外,还包含转录组数据、蛋白组数据以及代谢组等多组学方面的数据。
其次,我们还会收集并构建人体微生物组中菌群的泛基因组数据集。
再有,我们想开发一套以功能为主的新型聚类方法,与人体的表型数据相关联。
以上就是我汇报的全部内容,感谢各位老师,希望跟各位老师多多交流。谢谢!