宁康等:利用同源序列解码菌群生态位关联,准确预测靶向蛋白结构
热心肠小伙伴们 2022-01-15
华中科技大学宁康团队与合作者在PNAS发表研究,建立了一个包含42.5亿个序列的四个主要生物群落的模型库,开发了名为MetaSource的机器学习模型来预测目标蛋白质的源生物群落,可显著提高联系图和3D结构模型的准确性,同时大幅减少计算机内存和CPU时间。研究的结果验证了重要的生物组-序列-Pfam关联,这可以为基于菌群的蛋白质结构和功能预测的靶向方法提供更高的效率和有效性。

近期,华中科技大学宁康团队与合作者在PNAS发表研究Decoding the link of microbiome niches with homologous sequences enables accurately targeted protein structure prediction。作者假设微生物生态位和蛋白质家族之间存在固有的进化联系,可用于构建精确的多序列比对(MSAs)。为了检验这个假设,作者建立了一个包含42.5亿个序列的四个主要生物群落的模型库,开发了一个名为MetaSource的机器学习模型来预测目标蛋白质的源生物群落,其可以显著提高联系图和3D结构模型的准确性,同时使用少于三倍以上的计算机内存和CPU时间。研究的结果验证了重要的生物组-序列-Pfam关联,这可以为基于菌群的蛋白质结构和功能预测的靶向方法提供更高的效率和有效性。

专家简介
宁康
华中科技大学生命科学与技术学院教授
生物信息与系统生物学系系主任
宁康,华中科技大学生命科学与技术学院教授,博士生导师,生物信息与系统生物学系系主任。2003年本科毕业于中国科学技术大学计算机科学技术专业,2008年博士毕业于新加坡国立大学生物信息学专业,2010年于美国密歇根大学完成博士后工作。2015年开始担任华中科技大学生命科学与技术学院基于生物信息与系统生物学系系主任。是“教育部分子生物物理重点实验室”、“生物信息与分子成像湖北省重点实验室”等多个省部级实验室的管理或骨干成员。在生物信息学领域从事科研工作10余年,研究重点方向为微生物组大数据的人工智能挖掘及其在健康与环境等领域的应用。目前主持国家自然科学基金项目、科技部重大研究计划课题等。已做为通讯作者在PNAS、Nature Communications、Gut、Annals of the Rheumatic Diseases、Genome Biology、Genome Medicine、Microbiome、Briefings in Bioinformatics、Bioinformatics、Nucleic Acids Research等生物学、医学和生物信息学顶级学术期刊发表学术论文100余篇,文章总引用超过6000次,H指数40(Google Scholar)。获得软件著作权6项,申请国家发明专利20余项。入选2021-2023年全球前2%顶尖科学家“年度科学影响力”(single recent year impact)榜单。担任Genomics Proteomics Bioinformatics、Microbiology Spectrum、iMeta等国际期刊编委。担任中国生物信息学学会-基因组信息学分会副主任等;担任湖北省生物信息学会秘书长等。2022年当选中国计算机协会CCF杰出会员。已作为主编出版中英文教材和专著6本,并是6届iGEM金牌团队的指导老师。
了解更多
相关推荐
评论
热门分类