编者按:
我们每天都会听到各种健康理论,可能今天听到是支持的结论,明天却变成了反对的声音。为什么营养学的结论总是在变化?营养学研究如何才能更加准确可靠呢?
今天,我们共同关注营养学研究中的不确定性,特别翻译发表在 Nature Food 杂志上关于营养学研究的文章。希望本文能够为相关的产业人士和诸位读者带来一些启发和帮助。
对于许多重大的社会挑战,决策者们利用大量证据来为决策提供依据。一些情况下,可靠的证据能推断因果关系;在其他情况下,证据可能直接证实因果关系。但是这两种方式都存在不确定性。
对给定的某一门科学,比如气候学、核物理学、天文学或经济学中的不确定性进行研究,并不代表该特定科学对决策者们有更多或更少的价值。但是,了解不确定性会帮助决策者们更深入地思考用于制定决策的数据的真实价值1,2。
鉴于营养科学对全球粮食和卫生政策的重要性,本文探讨了人类营养学研究中存在的一些不确定性,以供相关人士的参考。
饮食调查数据是存有缺陷的。大多数受试者低报了他们的每日能量摄入(即低于实际摄入值),这可能与体重、年龄、种族和社会经济状况等多种因素有关,而这种影响足够显著,会使结果产生巨大偏差。
目前使用最广泛的评估能量摄入低报值的方法是利用公式来预测基础代谢率。这些公式是根据年龄、身高、体重、性别与静息能量消耗的直接测量数据得出的。然后使用一个因子(factor)来计算身体活动的能量值。如果能量摄入值低于该方法得出的能量消耗值,则被认为是不合理的。
然而,研究表明只有少量采用上述方法的研究能够使偏差最小化,因此在研究中对能量摄入低报值使用这种临界值一直备受争议3。
另一种更加精确但也更昂贵的方法是使用双标记水来测量短期能量消耗值。
用于检测能量摄入低报值的所有方法均显示出受试者存在一定程度低报,从 -20%到 -40%不等。在 24 小时饮食回顾法中(用于美国国家饮食调查),这种低报能量摄入的影响是很大的,大约几百千焦。而在其他大队列研究使用的食物频率调查问卷法中(用于制定营养政策),这种能量摄入低报的影响就更大了。
对与能量低报密切相关的因素(体重、肥胖、年龄、吸烟、性别和社会经济状况)的数据进行统计校正,可以在一定程度上减少能量低报的混杂效应。
此外,利用一些新方法,比如将食物频率调查问卷和多个 24 小时饮食回顾法相结合,来收集原始摄食数据,能减少此种误差,但是这种方法很少被纳入研究方案4,5。
在使用饮食数据来制定政策的其他领域,如饮食化学暴露领域,已经成功通过数值试验,确定了人类暴露于食源性化学品的不同模型的优缺点。而且这些方法可能对使用数据库做营养学研究具有一定的价值6。
一些营养学家认为,能量摄入低报使能量摄入数据存在根本瑕疵,因此应该彻底停止这类数据的使用7。
尽管自我报告数据总会伴随着系统误差,但是不可否认的是,无论对错与否,这些数据都在吸烟、饮酒、身体活动、性习惯等公共健康领域起到重要作用。鉴于目前监测人群营养状况的迫切需求,不再从受试者身上收集饮食数据是不太可能的8。
因此,迫切需要研究者们在他们的研究中提供一些定量评估的方法,来衡量能量低报对健康结果的潜在影响。并且,还需要不断寻求能够改进测量误差的校正方法9,10。
在这一领域,我们应该承认,依赖自我报告的饮食数据是有局限性的。相反,我们应该共同寻求能够克服这种局限性的定性评估方法,当然最好是尽可能消除这种局限性。这就要求不同领域中的高水平机构进行合作,比如利用新型数字化技术、代谢组学中单一和多种生物标志物,以及联合使用多种不同自我报告饮食评估工具来进行研究。
鉴于自我报告的摄食量并不可靠,已经有越来越多人使用生物标志物来评估个体中特定营养物质的营养状况11。例如,用红细胞叶酸评估叶酸、用红细胞胆固醇酯二十碳五烯酸评估这种脂肪酸,以及用血清铁蛋白评估铁的状态。
然而,尽管这些生物标志物能用作长期营养摄入的标志物,以区分不同营养状况的受试者,但是他们不能完全量化摄入量。代谢组学分析最近被用于确定食物和营养摄入量12。然而,就食物而言,停止摄入目标食物后,尿液中对应的代谢物会很快消失,因此,源于特定食物的尿液代谢物取决于该食物的近期摄入量。
目前,那些无法产生独特尿液代谢物的营养物质,是很难用代谢组学分析衡量其摄入量的。比如脂肪和碳水化合物,其代谢终产物会随呼吸排出。虽然呼吸熵能告诉我们脂肪与碳水化合物被氧化的比率,但是它不能告诉我们摄入量的多少。
此外,如果脂肪的摄入量过低,可以利用体内储存的脂肪组织进行脂肪氧化。鉴于人类 85%的能量摄入来自于脂肪和碳水化合物,用代谢组学分析来计算能量摄入是十分困难的。不过代谢组学分析可被用于识别代谢类型,或者基于已建立的饮食模式分类,利用代谢组对代谢图谱进行聚类分析。
最近,一次美国国家卫生研究院(National Institutes of Health)研讨会指出,几个使用代谢组学数据作为生物标志物的领域急需提高。其中一个要求是“进行更大规模的控制性饮食研究,在不同人群中测试不同的食物和饮食习惯,以鉴定通用的候选生物标志物13。”假如要开发鉴定营养物质摄入的生物标志物,这一领域应当被优先考虑。
营养学解构了饮食并且提供了单一食物摄入数据。有人认为,这是非常必要的,因为食物成分表仅在单一食物水平应用,无法与饮食模式产生关联。要想在营养物质摄入和某一给定疾病或身体状况间建立联系,比如叶酸和神经管缺陷症,需要先检查目标营养物质的食物来源。
最终,营养学建议将集中在食物水平上,而不是营养物质水平。
饮食模式也很少在饮食水平开展研究,然而饮食水平的研究有助于我们理解食物之间的联系。比方说,如果发现乳制品摄入量与心血管疾病之间存在关联,也可能会发现乳制品摄入量较高与其他食物摄入量较低存在关联。
有少量研究已经研究了食物与食物之间的关联,他们表明,在建立以食物为基础的膳食指南时,的确不能忽视这种关联性。一项研究指出,咸味零食与软饮摄入量密切相关,白面包与黄油摄入量密切相关。与之相反,水果和蔬菜摄入量相关性很弱14。
如果没有这些数据,就很难证明单一食物或是某一类食物对任何健康结果有独特影响。收集饮食摄入模式的数据并建立代表不同饮食习惯的模式是有可能的。如果上述数据能与代谢组学分析结合,饮食及相关代谢组学分析研究进展将成为人类营养流行病学研究的一个重要元素。
一份美国国家科学院(US National Academies of Science)和工程与医学科学院(Engineering and Medicine)联合公报指出,一个能更广泛、更具体地解释可变性和不确定性的随机系统模型,将会是更可取的,因为做出尽可能透明、适用和稳健的膳食建议,才能提高对涉及食物成分和食用可变性的复杂系统的解释力度15。
在图 1 中,我们列出了一个整合了基于饮食模式和代谢组学分析去满足个性化营养需求的设想。
图. 该合作项目首先将由多个研究中心通过电话或互联网等方式对饮食模式进行调查,并在餐厅等地收集数据。对数据进行深度挖掘,以识别最常见的基于食物的饮食模式。为每个饮食模式设计一个时长 10 天的菜单,以开展居民膳食干预研究。在多个国际机构的支持下,受试者轮流接受部分或全部的饮食干预,并采集血样和尿液进行代谢组分析。然后建立代谢组的数据库,其中,不明饮食模式的个体的样本被分配为特殊的饮食模式。最终得出营养建议,建议可以是通用的,也可以是个性化的。
与所有的流传病学相似,营养流传病学,也主要依赖于使用统计模型来校正数据,排除干扰因素的影响。干扰因素包括年龄、性别、BMI、吸烟和酗酒习惯、未知病因的疾病家族史、身体活动和社会经济状况,然而,这些干扰变量可能不能完全涵盖调查中两组中存在的所有真实差异。
一项关于心肌梗塞后服用鱼油的研究中,大量的受试者采访显示了几种通常不会在这种统计校正中考虑的干扰因素16。
相比于那些没有服用鱼油的人,在心肌梗塞后服用鱼油的往往是白种人、已婚、经济状况良好、有健康保险且接受较好高等教育的人士,并且这些人更有可能会参与心脏康复训练,但是很少有酗酒史。
在鱼油和心脏病研究领域,通常不会把这些潜在的干扰因素差异考虑到数据的统计校正中,因此需要鼓励更多研究来审视营养流行病学中干扰因素的问题17,18。
这就引发了一个问题:在营养流行病学中如何全面涵盖干扰因素?近来,研究者们越来越关注这一领域中的暴露组数据。正如基因组绘制了个体的所有基因数据,暴露组理论上涵盖了个体暴露在环境中所有可能的环境因素。
在美国,营养流行病学专家会定期使用来自国家卫生和营养评估调查(National Health and Nutritional Evaluation Survey,NHANES)的数据。只不过,许多学者只使用一些标准干扰因素,比如吸烟和身体活动。NHANES 有大量关于环境暴露组的数据,但是在营养流行病学背景下它们却被忽视了。
最近一项探究了 NHANES 在 1999~2000、2001~2002、2003~2004 和 2005~2006 这四个时期调查的研究,分析了每个时期的营养物暴露、污染物暴露和病原体暴露的关联19。在这四个时期中,共发现了 81937 种关联。至少在四个时期中重复两次的有 2656 种关联,并且该研究还构建了暴露组生态圈。
这些相关系数的中位数是 0.5(四分位间距为 0.39~0.64),这显示出营养物质、污染物和病原体的单一暴露之间以及这些暴露和 2 型糖尿病的相关水平均非常可观。
这些研究强调,在营养流行病学中,我们需要更全面地寻找潜在的干扰因素20。要想充分记录暴露组,需要一个人从出生以来的数据和家族史数据。这将是一个远比人类基因组更密集、更复杂的数据库。虽然目前还无法实现,但是必须现在就开始全面调查不同流传病学群体中受试者所经历的历史事件。
无论营养流行病学中使用的暴露组学综合性如何,因果性和效果仍然是棘手的问题。
现代流行病学发展伊始,为评估流行病学研究确定因果性的效力,奥斯汀·布拉德福德·希尔(Sir Austin Bradford Hill)定义了九大准则:相关性的强弱、一致性、特异性、时间序列、剂量-效应关系、合理性、条理性、实验证据和类比性。
而在营养流行病学中,其中五个布拉德福德希尔准则应该被重点关注,分别是:一致性、相关性强弱、剂量-效应关系、合理性和时间序列。
然而在饮食和疾病研究中,很少有能够同时满足五个准则或是一个都不满足的研究出现,在一篇论文中,作者表示:“我们认为,尽管传统的因果标准有所不足,但其对于制定公共卫生建议仍然具有重要意义。尽管如此,我们也认为在绝大多数情况下,不可能仅凭这些标准就为公共卫生决策制定一套单一的规则21。”
越来越多学者使用荟萃分析来评估研究结果的一致性,但是荟萃分析虽然能减少抽样误差,却会累积偏差值22。例如,人们普遍认为维生素 D 的循环水平和肥胖之间相关。虽然一项对观测数据的荟萃分析结果显示,肥胖与循环维生素 D 含量水平低相关,但是另一项使用孟德尔随机化研究显示,两者并无相关性23,24。
回顾了 298 篇学术论文后,一篇发表在一流医学期刊的综述表明,大部分(58%)论文使用他们报道的观察性数据制定临床建议。
通常情况下,荟萃分析被认为是对给定主题的决定性评估过程,是通过纯粹的科学探究,形成风险管理的结论,是一个纯粹的制定政策的过程。
收集人类营养学的科学数据就是风险评估的一种形式。实际上,使用这种数据来制定政策也是一种风险管理。通常,在政策建议遵循科学数据的营养学中,这如同孪生般的两个过程是混在一起的。
因此,在人类营养学领域,负责风险管理中一方的科学工作者们,有责任确保另一方人员——即制定政策的风险管理者们已经充分评估了摆在他们面前的数据的优缺点。
因此决策者们需要在制定公共卫生营养政策的决策中借鉴已经建立好的框架25。从营养学到气候变化,在很多科学领域中,我们必须接受不完美的数据。但是,对这种缺陷以及对政策和立法的影响保持清醒,并且能不加掩饰地说明局限性是十分必要的。
参考文献:
(滑动下文查看)
1.Allison, D. B., Pavela, G. & Oransky, I. Am. Sci. 106, 84–87 (2018).
2.Reproducibility and Replicability in Science (National Academies of Sciences, Engineering and Medicine, 2019).
3.Ejima, K. et al. Am. J. Clin. Nutr. 110, 1231–1239 (2019).
4.Freedman, L. S. et al. Am. J. Epidemiol. 187, 2227–2232 (2018).
5.Banna, J. C., McCrory, M. A., Fialkowski, M. K. & Boushey, C. Front. Nutr. 4, 45 (2017).
6.Gilsenan, M. B., Thompson, R. L., Lambe, J. & Gibney, M. J. Food Addit. Contam. 20, 61–72 (2003).
7.Dhurandhar, N. V. et al. Int. J. Obes. 39, 1109–1113 (2015).
8.Subar, A. F. et al. J. Nutr. 145, 2639–2645 (2015).
9.Murillo, A. L. et al. Obesity 27, 489–495 (2019).
10.Keogh, R. H. & White, I. R. Stat. Med. 33, 2137–2155 (2014).
11.Prentice, R. L. Am. J. Clin. Nutr. 108, 433–434 (2018).
12.Guasch-Ferré, M., Bhupathiraju, S. N. & Hu, F. B. Clin. Chem. 64, 82–98 (2018).
13.Maruvada, P. et al. Adv. Nutr. 11, 200–215 (2019).
14.Kearney, J. M., Hulshof, K. F. & Gibney, M. J. Public Health Nutr. 4, 693–698 (2001).
15.Redesigning the Process for Establishing the Dietary Guidelines for Americans (National Academies of Sciences, Engineering and Medicine, 2017).
16.Harris, W. S. et al. Nutr. Res. 36, 65–71 (2016).
17.Steegen, S. et al. Perspec. Psychol. Sci. 11, 702–712 (2016).
18.Shaw, P. A. et al. Stat. Med. 35, 3883–3888 (2016).
19.Patel, C. J. & Manrai, A. K. Pac. Symp. Biocomput. 20, 231–242 (2015).
20.Barabási, A.-L., Menichetti, G. & Loscalzo, J. Nat. Food 1, 33–37 (2020).
21.Potischman, N. & Weed, D. L. Am. J. Clin. Nutr. 69, 1309–1314 (1999).
22.Vinay, P. et al. Rev. J. Clin. Epidemiol. 66, 361–366 (2013).
23.Yao, Y. et al. Int. J. Clin. Exp. Med. 8, 14977–14984 (2015).
24.Manousaki, D. et al. Circ. Cardiovasc. Genet. 9, 349–356 (2016).
25.Moberg, J. et al. Health Res. Policy Syst. 16, 45 (2018).
原文链接:http://www.nature.com/articles/s43016-020-0073-2
作者|Mike Gibney, David Allison, Dennis Bier & Johanna Dwyer
编译|李嘉秋
编辑|617
审校|笑咲