无
日前,《Science Bulletin》(《科学通报(英文版)》)在线发表了题为“The iLABdb:a web-based integrated lactic acid bacteria database”的文章(DOI:10.1016/j.scib.2023.09.016)。到底是谁为乳酸菌的产学研并进构筑了这座转化的桥梁?不少人心中早有答案,正是内蒙古农业大学张和平教授带领的研究团队。
热心肠旗下《肠道产业》有幸在2022年5月初,曾对张和平教授进行专访,令人感慨的不仅是那些年不懈的中国菌探索之路,更有实现乳酸菌从实验室到产业化的远大目标。同月月底,他因“热心肠奖·2022年度科学家奖”受邀在获奖者论坛上深请讲述了“3万株乳酸菌背后的故事”。
如今,张和平教授带领部分团队成员再次接受《肠道产业》专访,娓娓道来iLABdb数据库的建设历程,以及执着乳酸菌研究背后的“中国梦”。
受访专家
张和平 内蒙古农业大学乳品生物技术与工程教育部重点实验室教授
孙志宏 内蒙古农业大学乳品生物技术与工程教育部重点实验室研究员
张家超 海南大学食品科学与工程学院教授
靳 昊 内蒙古农业大学乳品生物技术与工程教育部重点实验室在站博士后
iLABdb的建立,乳酸菌研究领域的“里程碑事件”。
为什么会为乳酸菌(LAB)专门建一个数据库?这可能是不少人心中的疑惑。
在人类历史的长河中,众多的食物与乳酸菌发酵有关,如今业已广泛应用于食品工业、健康医疗、农业和生态保护,更是被公认为最重要的微生物战略资源之一。
张和平教授与乳酸菌的故事要追溯到1989年。从那时起,他开始带领团队跋山涉水,克服重重困难,采集自然发酵乳制品(如发酵牛乳、马乳、驼乳、羊乳、牦牛乳、奶酪)等,足迹遍及全球32个国家,采集6202份样品,分离、保藏乳酸菌47 573株,涵盖乳酸菌的33个属、138个种和亚种。
历时30余载,建成了全球最大的乳酸菌种质资源库,为乳酸菌研究和利用提供了不可或缺的珍贵资源,今年入选了“国家首批农业微生物种质资源库”。
张和平团队跋山涉水采集自然发酵乳制品样品
不止于此,他敏锐地前瞻性洞察到基因组技术将为乳酸菌资源的开发与利用注入创新活力,于是带领团队开始书写“全球最大的乳酸菌基因数据库”的蓝图。
2008年,采用第一代测序技术完成干酪乳杆菌Zhang全基因组序列测定分析,实现我国首个独立完成、具有完全自主知识产权的乳酸菌序列测定。
2013年,建成中国最大的、具有自主知识产权的、原创性的乳酸菌16S rRNA基因数据库。
2015年,采用二代Illumina HiSeq 2000高通量测序平台绘制出乳杆菌模式株基因组细致图谱。
2018年,启动“万株乳酸菌基因组计划”,打造世界上最大的乳酸菌基因组数据库,预期到2024年完成3万株乳酸菌分离株的基因组测序工作。
迄今,他们利用自建菌种资源库中11 678株完成测序的乳酸菌全基因组序列,结合公共数据库中51 900个乳酸菌基因组数据,建成了全球最大的乳酸菌基因组、功能研究数据共享数据库和平台iLABdb(https://www.imhpc.com/iLABdb)。
iLABdb数据库堪称“乳酸菌百科全书”
据张和平教授介绍,数据库不仅汇集了大量的乳酸菌基因组序列和元数据信息,还提供了关于乳酸菌序列分析、可视化和数据共享的工具。团队还计划扩大数据的覆盖范围,纳入更多的乳酸菌相关基因组和与健康相关的临床研究数据。
“这是一个异常艰辛的过程,我们希望到今年年底完成2万株,2024年达成3万株乳酸菌分离株的基因组测序工作,提前达成‘万株乳酸菌基因组计划’的既定量级目标。”张和平教授带领团队始终走在科研创新的路上。
iLABdb的价值,将最大释放“数据生产力”。
用于食品加工和生物制品的生产,作为膳食补充剂和活菌药物的重要成分,推进动物健康养殖,控制植物病害、助力农药降解、提升作物产量……乳酸菌展现出不可估量的价值和开发潜力。
“不能让我们的科研成果一直躺在实验室里,我们要把它转化成生产。”面对这个现实命题,将乳酸菌研究视为终身追求的学术专家张和平,果敢地开启了他的产业新征程,而一个能够对乳酸菌进行高效挖掘的数据共享平台成为迫切的需求。
发韧于20世纪50年代的信息技术革命,在经历了半个多世纪的扩散和普及后,推动人类社会进入一个新时代——数据生产力时代。正如习近平总书记所指出的:“在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。”
上万株乳酸菌意味着将产生浩瀚的数据,如何满足如此海量的计算需求以及数据存储、调用之需?这得益于人工智能、大规模通用计算系统的普及与发展,iLABdb正是受益于呼和浩特得天独厚的绿色算力发展优势,在内蒙古“青城之光”高性能计算公共服务平台算力资源的支撑下建设而成。
内蒙古高性能计算公共服务平台“青城之光”
荣获“2020年中国高性能计算机性能排行”第四名
除了自行测序完成的乳酸菌基因组数据,iLABdb还整合了来自美国国家生物技术信息中心(NCBI)、人类胃肠道基因组(UHGG)数据库、基因组分类数据库(GTDB)、各种食品宏基因组数据集等的数据,涵盖六大洲、横跨101个国家和地区。
内蒙古农业大学孙志宏研究员进一步透露,“它不仅纳入了有关地理来源、现有数量、临床信息、基因组提交和分析等关键信息,充实了提交、分享和分析功能,我们还鼓励用户通过‘基因组搜索和分析’模块分析他们的乳酸菌基因组。”
“iLABdb无疑链接了科学研究与产业应用,实现了资源的共享与协同利用,为产业研发人员从多方向、多领域、多学科融合,完整、循证、深刻地认识乳酸菌,精准、高效地发掘乳酸菌的新价值与新应用,更为产业的可持续发展提供了实质保障。让数据真正发挥出生产力价值!”张和平教授如是说。
今年年初发布的“2022中国食品科技十大进展”中,张和平团队的科研成果《基于人工智能的益生乳酸菌精准筛选及产业化关键技术》赫然在列。而这只是基因组大数据和人工智能技术赋能乳酸菌产业发展的一个缩影。
iLABdb的未来,与世界共享“中国成果”。
20世纪90年代初期,目睹了内蒙古大草原自然发酵乳酸菌被日本学者收集带走,“我们有非常好的资源,为什么让别人拿走了!”了解到国内乳品工业,特别发酵乳制品虽已进入高速发展时期,但生产仍严重依赖国外,“我们这么大的国家,如果一直依靠进口,这样是不对的!”张和平教授决定投身乳酸菌研究。
从1989年踏上乳酸菌研究之路至今,他带领团队陆续开展乳酸菌种质资源与生物多样性研究,开启乳酸菌万株基因组计划与群体基因组学,搭建益生菌精准筛选技术平台,攻关乳酸菌制剂产业化关键技术、高活性复合益生菌发酵乳加工关键技术,开发的菌株和技术在国内15家乳品企业以及益生菌企业、大健康科技企业等实现成果转化应用。
他不仅帮乳酸菌走出实验室服务国人,更让世界感受到“中国实力”。
菌种和技术全链条助推乳酸菌产业、乳业高质量发展
左图:科拓生物智慧化乳酸菌生产工厂
右图:部分合作企业及产品
作为团队“十四五规划”的重要组成,在菌种资源库建设的基础上,iLABdb是持续落地乳酸菌资源开发利用的基础研究,也是乳酸菌制剂和乳制品加工技术研发与产业化的基石。
欢迎登陆iLABdb官网
(https://www.imhpc.com/iLABdb)
攻克了基因组信息缺失、全基因组数据鲜有公开、基因组数据冗余等一个又一个难题后,iLABdb的独特之处也凸显出来。张和平团队的靳昊博士后难掩兴奋:“它首创性地将菌种资源、基因组信息、临床试验数据整合在一起,而且实现了最大生长速率、代谢基因簇、抗生素抗性基因、毒力因子等重要指标分析。”
海南大学张家超教授特别提到iLABdb的一大特色模块——明星益生乳酸菌菌株。“它不仅囊括了经过临床验证、公开基因组序列的国际知名菌株,包括LGG、BB12,更是向世界展示了具有自主知识产权的国内菌株,如干酪乳杆菌Zhang、植物乳杆菌P-8、乳双歧杆菌V9等明星菌株。我们希望让关注乳酸菌的全球产学研人士更多了解中国学者的贡献,也积极推进这些优质菌株的协作研究与转化应用。”
“我们的数据库完全开放、共享,也欢迎您将基因组、明星菌株信息、临床试验数据上传提交,促成全球研发人员的交流合作与携手并进。”张和平教授补充到。
这些只是iLABdb 1.0版的特色和功能,随着不断扩充与完善,2.0版将实现对乳酸菌遗传特性、遗传潜力和进化溯源的深入分析,3.0版将基于人工智能实现更广泛、更深入、更聚焦的乳酸菌功能预测。
张和平教授带领团队为全球研究者提供了宝贵的乳酸菌资源和平台,为未来乳酸菌的研究和应用奠定了坚实的基础,也必将为中国乃至全球的产学研标准制定贡献智慧与力量。
随着科学界对这一领域的持续关注和探索,以及人工智能和大数据的加持,乳酸菌资源开发必将迎来全新纪元,成为人类科学史和文明史上浓墨重彩的一笔。
点击阅读: