肠道菌群被认为是人体的 “微生物器官”,其功能与宿主代谢、免疫等方面的生理和病理状态息息相关[1]。肠道菌群受环境、膳食和宿主等因素的影响,而膳食被认为是决定肠道微生物的群落结构和功能的关键因素[2]。通过膳食调节肠道菌群,从而调节宿主的生理机能,是一种公认的营养干预策略[3]。随着人工智能在肠道菌群干预靶点发掘中的应用及多组学技术的发展,近年来,通过膳食干预靶向调节肠道菌群,从而缓解各类疾病的发生、发展逐渐成为可能。本文从定义、开发流程、靶点发掘和目前在各类疾病中的应用等方面对肠道菌群靶向性食品(Microbiota-directed food,MDF)进行介绍,旨在为MDF 的开发和应用提供理论基础和思路借鉴。
2017 年,Green 等[4]在发表于《Science》的一篇文章中首次提出了MDF 这一概念。MDF 是指为改变消费者肠道菌群特性而设计的产品。区别于传统食品,MDF 在设计时便有意地针对特定的肠道菌群,提供一些健康人体所需的可由微生物群进行转化的底物,从而特异性改变肠道菌群的特征及功能特性。同时,Green 等[4]认为,MDF 在应用时,需要声明其营养成分及健康效应,若所添加的成分以及其微生物转化产物对人体造成的影响都可达到美国GRAS(Generally Recognized as Safe)的标准,则可将其列为传统食品;若其中的任何成分未达到GRAS 的标准,则需要对其进行广泛的安全性测试;此外,特殊情况下,MDF 也可被分类为药物。
肠道菌群靶向性食品的开发需微生物学、食品科学和营养学等多种学科交叉应用[5](图1)。首先,通过移植特定疾病人群肠道菌群的悉生动物模型来识别影响其肠道菌群的食品成分,使开发者了解在特定的饮食和肠道菌群环境中,哪些食品成分对宿主有益。其次,食品科学技术的应用可以对这些食品成分的来源、成本和加工方式等进行精细地分析,保证加工过程不会损失这些食品成分的生物活性和完整性以及所生产的食品具有可接受的感官特性。最后,在获得成熟的MDF 配
图1 肠道菌群靶向性食品的开发流程[5]
Fig.1 Development process of microbiota-directed food[5]
图2 针对营养不良的MDF 研发历程
Fig.2 MDF development process for malnutrition
图3 PPT 饮食的开发流程
Fig.3 Development process of PPT diet
方后,通过人群试验评估动物模型中的微生物群研究结果在人群中的可复制性,并挖掘其内在机制,形成完整的临床干预流程。
近年来,随着分子生物学、基因组学、生物信息分析技术、高通量测序技术的快速发展,肠道菌群研究取得了突飞猛进的发展。尤其是组学技术和高通量测序技术的发展和进步产生了大量微生物组数据集,为全面研究肠道微生物并揭示其与健康的关系提供了契机[6-7]。大量研究证明,肠道微生物群与消化、吸收、代谢、免疫等功能密切相关[8]。人类肠道菌群已经被越来越多地用作非侵入性疾病筛查和诊断的生物标志物,有些甚至成为疾病治疗和干预的靶点。
目前分析肠道微生物组最常用的测序方法是扩增子测序和宏基因组测序。在扩增子测序方法中,样本通过特定区域的分类标记基因进行表征,如16S rRNA 区域[9]或ITS 区域[10]。通常情况下,预先定义的阈值范围大致确定了原核生物分类单元,并创建了操作分类单元(Operational taxonomic units,OTUs)[11]。宏基因组学则是通过非特异性测序对样本中的全部基因组进行测定[12]。通过不同的算法,基因组读取可与数据库对齐,通过MetaPhlAn 等工具对数据进行功能或分类学注释[7]。此外,宏基因组学能够使用MetaBAT2[13]等分箱策略从菌群中回收宏基因组来组装基因组,进而解析基因组[14]。
在下游分析中,微生物组数据类型的多元性和高维稀疏性,使得其在分类学解析和数据分析方面都存在着许多争议和挑战[15-17]。首先,微生物组数据即微生物特征表是多元的,特征成分描述了单个样本内部各特征组成之间的关系,而不同样本特征成分的总和是任意的[18]。针对这一问题,目前可以通过对肠道菌群进行绝对定量协同相对定量来解释和分析[19]。其次,微生物数据通常是高维且稀疏的。由于不同样本的特征数量大,且随着样本数量的增多,特征数量也随之增加,因此微生物组数据是具有高维度的,从而产生“维度灾难”[20]。与此同时,高维数据表中就会产生过多的零作为结果[21],从而使微生物组数据具有稀疏性。肠道微生物组的数据特殊性使得下游分析中需要慎重选择数据处理方法,从而有效控制计算成本和提升其对其它数据集的泛化能力[22]。传统的对数比率转换方法无法处理微生物组数据的稀疏性问题,因此经常使用伪计数的方法代替数据中的零[23]进行计算和分析。在克服维度灾难方面,特征选择和特征提取是目前主要采用的方法。特征选择需要选择相关和非冗余特征的最佳子空间[24-25],剔除不重要的特征,从而减少数据的维度。相比之下,特征提取则通过压缩原始数据的维度来降低数据集的维数,从而保留数据中的关键信息[26]。在处理微生物数据时,特征选择和特征提取方法可以根据具体情况组合使用,还有很多新的方法应运而生[27]。总之,要根据肠道微生物组数据自身的特性要求对数据进行合适的预处理,这将对后续差异特征分析产生深远影响,势必会影响人工智能方法的性能[28-29]。
机器学习(Machine learning,ML)是人工智能方法的一个子集,它能利用大型数据集来完成识别、分类和预测任务。在微生物组研究中,ML 已被应用于处理表型分析(即预测宿主健康表型)、微生物特征分布(即确定微生物群的丰度或多样性),研究微生物组特征之间复杂的物理和化学相互作用以及监测微生物组组成结构变化等[30-31]。
2.2.1 机器学习经典方法 线性回归、随机森林(Random forest,RF)和支持向量机(Support vector machine,SVM)等经典的ML 方法在微生物组数据处理上应用广泛且表现良好[32-33]。其中,随机森林由多个决策树(Decision tree,DT)组合而成,通过从随机抽取的特征子集中生成多个DT,从而组装成一个RF,其性能比单个DT 有所提高[34]。目前,科学家使用这些经典的机器学习算法在结直肠癌(Colorectal cancer,CRC)[35]和炎症性肠病(Inflammatory bowel disease,IBD)[36]等队列中进行肠道菌群干预靶点的挖掘研究,并基于肠道菌群开发了20 种疾病的诊断工具[37]。Liu 等[38]使用DT、RF、梯度提升回归树(Gradient boosted regression trees,GBDT)、自适应增强算法(Adaptive Boosting,AdaBoost)等机器学习经典算法对5 个国家870 个人的粪便宏基因组数据进行分析,发掘了42 个肥胖人群肠道微生物标志物,并通过叠加强化学习和反事实推理算法得到包括嗜黏蛋白阿克曼氏菌(Akkermansia muciniphila)、普拉梭菌(Faecalibacterium prausnitzii)、普雷沃氏菌(Prevotella copri)、多氏拟杆菌(Bacteroides dorei)在内的潜在肥胖干预靶标。Chu 等[39]通过RF 发现痛风患者肠道菌群中富集的外唾液酸酶基因(15049[Exo-α-sialidase])、DNA 甲基化 酶基因(415936[N-6 DNA methylase])、含有松弛酶/动员核酶结构域的蛋白基因(1697136[Relaxase/Mobilization nucleasedomain-containing protein])等具有作为肠道菌群干预靶点基因的潜力。肠道屏障在肠道疾病的发展过程中也扮演着重要角色,RF 算法揭示了肠道菌群阿德勒克罗伊茨菌(Adlercreutzia)、Colidextribacter、梭菌(Clostridia UCG 014)、狭义梭菌属1(Clostridium sensu stricto 1)与肠道屏障之间的相关性,这使发现潜在调节肠道屏障的靶向微生物成为可能[40]。线性回归方法是将输出(如健康表型)建模的线性组合方法,对输入数据的解释性更强、更直观,常用的方法有Lasso 和弹性网等。这些线性回归方法被应用在宿主肠道菌群失衡预测研究中,其中弹性网的效果优于其它方法[41],Anaerostipes 和罗姆布茨菌属(Romboutisa)被发现在疾病人群的肠道菌群中丰度较低。另一项基于中国人群的队列使用线性回归模型评估了饮食或生活方式与血糖相关肠道微生物群的关联,确定了25 种肠道菌群与血糖的关联,如Erysipelatoclostridium、戴阿利斯特杆菌(Dialister)、梭杆菌(Fusobacterium),这些物种有望成为2 型糖尿病的诊断标志物或干预靶点菌群[42]。
2.2.2 机器学习降维技术 无监督机器学习方法可以降低维度、简化数据并实现可视化,以便研究学者对这些高维且复杂的数据进行理解和解释。通过计算现有特征的线性或非线性组合,无监督方法将输入的数据进行压缩并表示出来。其中,主成分分析(Principal component analysis,PCA)和主坐标分析(Principal coordinate analysis,PCoA)是可视化和对比微生物群落的常用工具,例如识别微生物群样品的来源[43-44]。在肠道菌群干预靶点的发掘工作中,无监督方法扮演着重要的角色,它们往往能对不同的类群进行降维,从而协助肠道菌群健康干预靶点被更好地挖掘,如使用PCoA成功区分IBD 患者与健康个体的肠道菌群[45]。Mujagic 等[46]更进一步地发现不同肠易激综合征(Irritable bowel syndrome,IBS)患者亚群可能与血清素及其代谢物5-羟基吲哚乙酸酯的血浆水平等因素有关。在对非酒精性脂肪肝病(Nonalcoholic fatty liver disease,NAFLD)患者的粪便宏基因组和代谢组数据降维后发现,瘤胃球菌(Ruminococcus)、布劳特氏菌(Blautia)、多尔氏菌属(Dorea)的丰度在患者粪便中增加,而颤螺菌属(Oscillospira)的丰度则呈现相反的趋势,这也意味着它们可能成为NAFLD 潜在的肠道菌群干预靶 点[47]。t 随机邻 域嵌入(t-Stochastic neighbor embedding,t-SNE)和均匀流形近似和投影(Uniform manifold approximation and projection,UMAP)这样的方法则能够捕捉和显示复杂微生物组数据集中的局部和非线性关系,然而它们的优化过程较为繁琐[48-50]。
由于菌群数据具有高维性、稀疏性和复杂性,因此传统的机器学习方法缺乏足够的学习和表示能力。相比较于传统的机器学习方法,深度学习方法可以从大量数据中自动学习端到端模型,无需手动进行特征设计。因此,深度学习可以发现高度复杂的相关特征,为肠道菌群干预靶点的发掘提供新的有效手段。
深度学习是机器学习的子学科,它是一种通过神经网络来对数据进行表征学习的方法[51]。神经网络是由大量的节点(或称神经元)按照不同的方式相互连接构成的具有拟合和回归分析等特定功能的网络结构。深度神经网络是多个浅层单元的累加,它可以模拟更加复杂的非线性关系和提取数据中更加抽象的特征信息。由于能够考虑数据的内在因素、微生物-宿主和微生物-微生物相互作用以及挖掘肠道关键菌群微生物和外部因素的潜在联系,深度学习能够辅助研究人员更加有效地发掘出与人体健康和疾病相关的肠道菌群的干预靶点。
2.3.1 宏基因组原始数据处理 由于宏基因组数据中高维度和稀疏性的表格是一维向量,不是深度学习方法最合适的数据形式,因此,对宏基因组数据进行数据形式的转换是将深度学习方法应用于肠道微生物等生物标志物与疾病关系研究的基础[52]。卷积神经网络是由卷积层、下采样层和激活层进行交替重复连接构建出的网络结构,在图像识别等领域中得到广泛的研究。基于卷积神经网络的深度学习方法被证明有助于增强对宏基因组数据的表示学习和跨队列生物标志物的预测,并表现出优于传统的机器学习方法和全连接神经网络的良好性能[53-54]。PopPhy-CNN[55]采用OTU 丰度填充系统发育树,并将树转换为易用于卷积神经网络的二维矩阵,所提出的卷积神经网络则基于该二维矩阵来探索微生物类群系统发育树上的空间关系及其在宏基因组中的数量特征,从而预测宿主表型,为基于微生物类群早期诊断相关宿主疾病提供了一种有效的方法。Shen 等[56]将宏基因组表格数据转换为空间相关的彩色图像类型的3维张量表示,采用基于ConvNet 的深度学习模型分别对2 型糖尿病和炎症性肠病等5 种疾病进行宿主表型预测和疾病特异性微生物生物标志物的鉴定,并验证了丁酸弧菌(Butyrivibrio species)、普拉梭菌(Faecalibacterium prausnitzii)等抗炎细菌能够作为2 型糖尿病治疗的潜在靶点。
2.3.2 微生物组数据压缩 微生物组数据的高维性通常在数十万的数量级,而样本量很低,这种不平衡导致数据高度稀疏,给数据的建模分析带来了维数诅咒的问题。在深度学习算法中,自动编码器能够通过编码-解码架构实现数据的压缩降维并学习输入数据的潜在表示[27]。其中,编码器部分被用于将输入数据压缩为潜在空间表征,解码器部分被用于对输入数据的重构。目前,自动编码器已被用于微生物组关联研究中来预测微生物组与疾病状态之间的关系,并进一步挖掘与癌症等疾病相关的微生物靶点。Oh 等[57]提出一种针对癌症免疫疗法的可解释性自动编码器DeepGeni,该方法采用编码器将源微生物组轮廓转换为潜在表示,然后将潜在表示通过分类器实现对微生物驱动的免疫检查点抑制剂的反应性预测,最后,再通过解码器中的可解释性链路传播过程来识别与免疫检查点抑制剂治疗中的粪便微生物群移植或益生菌发掘相关的潜在微生物靶点,如厌氧棍状菌属(Anaerotruncus)、罕见小球菌属(Subdoligranulum)等,有望改善癌症免疫疗法的效果。Wang等[58]通过稀疏自动编码器将由微生物和疾病相似性矩阵构建的微生物-疾病对映射到低维空间,然后将低维特征提供给光梯度增强机(LightGBM)对未知微生物-疾病对进行分类预测,通过计算疾病与微生物之间的关联分数,发掘出球形梭菌(Clostridium coccoides)与CRC 之间的潜在联系,以及鞘脂单胞菌科(Sphingomonadaceae)与IBD 之间的潜在关联。
2.3.3 微生物组的时间序列分析 能够将数据信息流以一种循环的方式进行组织传递的循环神经网络和长、短期记忆网络等深度学习模型常被用于有效预测微生物组数据的时间依赖性和动态模式,在基于人类肠道微生物组数据进行候选抗菌肽预测的研究中展现出突出潜力[59]。Ma 等[60]将长短期记忆网络与BERT 等模型结构相结合来挖掘潜在抗菌肽的相关宏基因组和元基因组数据,并使用候选抗菌肽和细菌之间的相关分析进行过滤,从而获得可用于化学合成和体外验证的候选抗菌肽。综上所述,深度学习模型是微生物组研究领域的强大工具,在肠道菌群干预靶点的发掘研究中具有重要的研究意义。
营养不良持续威胁着全世界数百万人的生命,发展中国家5 岁以下儿童营养不良的流行率令人震惊。世界卫生组织(World Health Organization,WHO)和联合国儿童基金会(United Nations Childers's Fund,UNICEF)报告称,2017 年,全球有1.508 亿(22.2%)5 岁以下儿童发育迟缓,5 050 万(7.5%)儿童的生命受到威胁[61]。根据联合国儿童基金会营养不良原因的概念框架,儿童营养不良的最常见和最直接的原因是膳食摄入不足和疾病导致生长和发育不足。近年来,科学家发现肠道微生物群也可能是引发营养不良的重要原因。
美国华盛顿大学医学院教授Jeffrey Gordon及其团队2013 年发表在《Science》杂志上的报道[62]有力证实了肠道微生物群可能导致营养不良。该纵向研究中,针对马拉维317 对双胞胎,持续观察前3 个月内的生长情况,其中7%的双胞胎患有kwashiorkor(一种严重急性营养不良的形式)并与肠道微生物群有关。宏基因组分析发现,317对双胞胎中营养不良儿童的肠道菌群与健康儿童存在显著差异(37 个OTU)。为验证这种差异能否作为导致营养不良的因素,该团队对无菌小鼠分别移植来自12 对营养状况不同的双胞胎(排除了遗传、饮食、环境、性别、地理位置等的影响)的肠道微生物群,结果发现接受营养不良儿童菌群的小鼠出现相同症状,这一结果表明肠道微生物群与营养不良之间存在因果关系。
在证实了肠道菌群作为可能诱导营养不良的因素后,Gordon 团队猜想营养不良儿童与健康儿童肠道微生物群中的差异OUT 是否在其中起到关键作用。随后,该团队进一步扩大样品分析范围,对马拉维南部5 个农村的643 个儿童进行宏基因组菌群分析,发现13 个OTU(共生梭菌、活泼瘤胃球菌等)的相对丰度与营养不良呈负相关关系[63]。同时,将营养不良与正常儿童菌群分别移植至无菌鼠,并共室培养,发现营养不良鼠体质量有所恢复,并伴随着9 个OTU,包括上述宏基因组结果中的共生梭菌、活泼瘤胃球菌等菌种从健康菌群鼠转移至营养不良菌群鼠,虽然这一发现再次证实了差异OTU 与营养不良密切相关,但是仍无法明确其在营养不良中的作用。因此,该团队挑出显著性最高的前5 个OTU(含共生梭菌、活泼瘤胃球菌等)灌胃至营养不良小鼠,其中共生梭菌和活泼瘤胃球菌成功定殖,有效改善了小鼠体质量,并调节宿主代谢,避免氨基酸氧化,该结果表明共生梭菌、活泼瘤胃球菌等可作为潜在对抗营养不良的肠道菌群。这项研究初步锁定了可对抗营养不良的关键菌群。
基于上述发现,Gordon 和他的团队试图通过易得食材开发MDF,以改善严重营养不良儿童的营养状况。他们用不同比例的香蕉、花生、鹰嘴豆和其它普通食物设计饮食,动物实验结果表明,这些饮食似乎可支持“健康”的菌群[64]。在移植营养不良菌群的小鼠身上,这种特殊的饮食有助于将这种营养不良菌群转化为与健康儿童相似的菌群。为进一步验证这种特殊饮食对营养不良的改善效果,在随后的临床试验中,研究人员将孟加拉国63 名中度营养不良的儿童分成4 组,分别补充针对营养不良的传统治疗性食品(RUTF)和3 种含有不同比例上述食物的特殊补充剂(MDCF-1,MDCF-2 和MDCF-3)1 个月,血浆蛋白质组学和代谢组学分析证明,营养不良儿童在补充MDCF-2 后骨骼生长、大脑发育、免疫功能等指标均得到改善,上述结果表明MDCF-2 能够有效缓解儿童中度营养不良。
为比较MDCF-2 和传统治疗性食品(RUTF)对于营养不良的改善效果,Gordon 团队2021 年发表在《New England Journal of Medicine》的一项更高规格的临床试验招募了孟加拉国118 名中度营养不良儿童,分为两组,分别接受MDCF-2 和传统RUTF,为期3 个月,每天2 次,并在试验停止后跟踪1 个月。结果发现,补充MDCF-2 的儿童健康状况得到改善:孩子们的身高、体质量、大脑发育及免疫功能都与健康同龄人相似的模式增长,而在RUTF 组中并没有出现相同结果,并且,在停止膳食配方的1 个月内,MDCF-2 对菌群和营养不良症状的恢复依然优于RUTF 组[65]。上述结果均表明MDCF-2 作为一种MDF 可有效缓解中度营养不良儿童的营养状况。
随着现代生活方式的改变和饮食结构的转变,越来越多的成年人受到血糖异常的影响。糖尿病前期是2 型糖尿病的一个关键危险因素,据估计高达70%的糖尿病前期患者最终会发展成为该疾病[66]。此外,糖尿病前期还与肥胖、高血压、非酒精性脂肪性肝病、高甘油三酯血症和心血管疾病等多种健康问题共同构成了代谢综合征,这给人们的健康带来了严峻的挑战[67]。
血糖管理被视为预防和控制代谢综合征的关键措施之一。然而,个体对相同膳食的反应具有高度的变异性,这提示传统的普遍饮食建议可能并不适用于每个人。为了实现更精准的血糖管理,Segal 团队在2015 年开发了一种能准确预测个性化餐后葡萄糖反应(PPGRs)的机器学习模型[68],该模型集成了临床和微生物组特征,为个性化饮食干预提供了有力的支持。在此研究中招募了800名非糖尿病人员,并利用动态血糖监测系统(CGM)持续监测受试者的血糖水平,分析在1 周内受试者摄入的膳食对于PPGRs 的影响。同时,试验建立了一种“机器学习”算法,该算法综合分析了受试者的饮食特征、血液参数、微生物特征等数据,基于该算法研究人员能够准确预测餐后血糖水平。另外,研究人员在100 人的独立队列中对该算法进行验证,结果表明:基于算法的个性化饮食干预,在短期内成功地降低了餐后血糖水平,并引起肠道菌群组成的显著改变,其中研究人员发现直肠真杆菌的高生长量与低水平的PPGRs 相关联。
为验证个性化餐后饮食能否作为一种有效的预防糖尿病前期的干预方法,2021 年Segal 团队利用“机器学习” 算法实现个性化餐后靶向饮食(PPT),并将PPT 饮食与现行预防糖尿病前期有效的地中海(MED)饮食进行比较,验证了个性化靶向饮食的可行性[69]。在此研究中,225 名糖尿病前期患者被随机分配摄入6 个月的MED 饮食或PPT 饮食,并连续检测患者的血糖水平和膳食摄入量。研究发现接受PPT 饮食的患者表现出更好的血糖控制。另外,两组之间血糖控制显著差异在额外6 个月的随访期间保持不变,也表明PPGRs的个性化饮食可能在改善血糖水平方面具有长期疗效。
PPT 饮食被证实有效,而干预环境中饮食调整、微生物组组成和宿主代谢反应之间的相互作用仍尚未阐明。2023 年,Segal 团队通过继续比对两种饮食干预,发现PPT 饮食干预组的饮食特征发生更为显著的变化,菌群α 的多样性和丰富性增加[70]。研究人员对多种饮食特征变化进行事后分析,发现特定饮食变化与菌群组成的菌种变化有显著关联,并通过因果介导分析检测到部分菌种能够介导特定饮食改变对临床结果的影响。其中3 个菌种(拟杆菌目、毛螺菌科、颤螺菌目),它们介导PPT 依从性评分与糖化血红蛋白(HbA1c),高密度脂蛋白胆固醇(HDL-C)和甘油三酯的临床结果之间的关联。最后,使用根据饮食变化和基线临床数据训练的机器学习模型,预测个性化饮食调整的代谢反应,并评估其对改善血脂、血糖控制等心脏代谢标志物临床的重要性。
越来越多的研究证实宿主健康与肠道菌群密切相关,肠道菌群一旦失调,将会导致很多健康问题,比如代谢紊乱、免疫失调、胃肠道疾病。这表明肠道菌群具有作为疾病预防或治疗靶点的潜力。许多因素影响着肠道菌群的平衡,其中食物是最重要、最直接的因素。MDF 通过重塑肠道菌群组成,在疾病研究中得到广泛的应用。
结肠炎疾病模型下的肠道菌群以肠杆菌科的异常增殖为特征。通过对DSS 诱导引发的结肠炎小鼠进行宏基因组测序发现,肠杆菌科的增殖通常伴随着钼辅因子依赖的微生物呼吸通路的富集,钼辅因子依赖的厌氧呼吸酶和甲酸脱氢酶对肠杆菌科,如大肠杆菌的繁殖扩增起至关重要的作用。通过基因敲除小鼠实验进一步验证了上述的猜想[71]。因此,抑制钼辅因子的生物合成途径,是改善结肠炎严重程度的有效措施。科学家通过体内试验、体外试验以及无菌鼠实验发现在机体炎症状态下,钨酸盐能替代钼辅因子中的钼,使辅因子在肠杆菌中失活,从而抑制肠杆菌科细菌的异常增殖。上述研究成果表明钨酸盐可以通过选择性调解炎症状态下失衡的肠道菌群,从而改善肠道炎症[72]。
克罗恩病(Crohn’s disease,CD)患者肠道菌群多样性显著减少。有研究[73]表明CD 患者体内微生物代谢产物短链脂肪酸(Short chain fatty acid,SCFA)中的丁酸含量较低,丁酸被宿主作为额外的能量补充,有助于保持上皮屏障的完整性。恢复这种特定SCFA 浓度可能有助于CD 严重程度的减轻。Bauer 等[74]将CD 患者和健康对照组的宏基因组数据与代谢数据整合到个性化的微生物群中,利用计算机模型研究肠道微生物之间的代谢相互作用,进而预测CD 患者和健康对照组的SCFA 水平。通过对比试验结果,对预测结果进行验证。结果表明CD 患者SCFA 水平较健康对照组低,且对CD 患者具有特异性。对CD 患者而言,进行个性化的MDFs 开发,以提高每个患者的SCFA水平,将有助于CD 患者的康复。
在动脉粥样硬化(Atherosclerosis,ACVD)方面,Jie 等[75]对来自218 名患有ACVD 患者和187名健康对照者的粪便进行全基因组关联研究,确定了ACVD 患者肠道菌群中的肠杆菌科和链球菌属的丰度相较于健康人显著增多,这些肠道微生物不仅能够抑制柔嫩梭菌等有益菌属的定植,还能将富含胆碱的食物转化为三甲胺(TMA),最终导致心血管疾病风险增加。有研究表明,TMA 生产途径中肠道微生物激酶活性的抑制减弱了体内动脉粥样硬化的发展[76]。因此,使用小分子来调节肠道菌群中影响疾病相关代谢物或信号分子是防治ACVD 的重要途径之一。Cheng 等[77]开发了一种大规模体外筛查方法,用于评估约1 500 种环状D/L-α-肽化合物对肠道微生物群的影响。将筛选出的环状D/L-α-肽进行体内小鼠实验,结果表明口服环状D-α-肽和L-α-肽能将食物造模的ACVD 模型小鼠的肠道微生物重塑为普通饲料喂养的状态,并且显著降低模型小鼠血浆总胆固醇,减少动脉粥样硬化斑块,从而防止了ACVD 的发展。此外,还有研究发现灵芝半萜衍生物(GMD)能够定向增加粪副拟杆菌的丰度,改善高脂饮食诱导的ACVD 小鼠的糖脂代谢并减轻动脉硬化损伤[78]。草药来源的双环醇也被证明可以减少高脂饮食造模的ACVD 小鼠的动脉板块并降低主动脉弓中的促炎因子的表达[79]。通过体外筛选能够定向重塑肠道菌群组成的活性物质似乎是一条新的防治ACVD 的研究思路。
此外,对报道过的关于肠易激综合征状态下肠道菌群组成的改变进行系统评价发现,这些研究结果虽存在一些重叠,但没有任何两项研究报告的肠道菌群存在相同的差异。这种差异可能是不同IBS 患者存在着肠道微生物组成多样性和异质性导致的。Karakan 等[80]基于此背景条件,招募25 名IBS 患者,将其分为个性化营养饮食组(n=14)和标准IBS 饮食组(n=11)。个性化营养饮食组是利用人工智能通过对个体肠道微生物特征进行算法优化,设计出个性化饮食。干预结果表明,基于人工智能的个性化饮食组显著改善了IBS 患者的症状。另外,拟杆菌和益生菌属丙酸杆菌在个性化饮食组也显著增加。
肠道菌群靶向性食品不仅有利于调节各种疾病状态下的肠道菌群,使机体转向健康状态,而且在健康机体状态下同样也可以促进肠道稳态。Michalak 等[81]针对肠道菌群中高产丁酸的益生菌罗氏菌属(Roseburia)和粪杆菌属(Faecalibacterium)中的独特的编码甘露聚糖的特异性多糖利用位点,设计了一种高度乙酰化的半乳糖甘露聚糖(AcGGM)纤维。为了验证设计的AcGGM 纤维是否可以在由100~1 000 种物种组成的“真实世界”肠道生态系统中专门针对罗氏菌属(Roseburia)和粪杆菌属(Faecalibacterium),研究人员将仔猪作为动物模型,对其喂食含有不同含量AcGGM 的日粮,为期28 d。利用宏基因组学解析其肠道菌群,通过定量代谢组学和碳水化合物微阵列分析不同肠道微生物群对不同含量AcGGM 水平的代谢和酶促反应。研究结果验证了AcGGM 能使肠道菌群中高产丁酸的益生菌罗氏菌属(Roseburia)和粪杆菌属(Faecalibacterium)富集,从而促进肠道稳态。综上,针对肠道微生物种群设计个性化的乙酰化膳食纤维,或许可以产生更强的肠道调节效应。
表1 MDF 在不同疾病模型中的应用
Table 1 Application of MDF in different disease models
注:“/”表示人工智能预测试验,无实际试验周期。
目前有大量研究证明特定膳食因子可以显著影响肠道菌群的结构和功能,MDF 相关产品更是体现出巨大的临床应用潜力。市面上的大多数膳食配方仅考虑了宿主对于各类营养素和膳食因子的需求,而未考虑这些营养素和膳食因子对肠道菌群结构与功能的影响,缺乏对肠道菌群干预的靶向设计。随着人工智能及多组学技术在肠道菌群相关领域的进一步应用,以及食品科学、微生物学、营养学及临床医学等多学科的交叉合作,通过膳食调节实现肠道菌群的靶向调控,从而调节宿主生理状态,将成为个性化、精准化营养调控的重要趋势。未来,除了思考自己想“吃什么”,更重要的是思考肠道菌群想“吃什么”,通过膳食调节,恢复肠道菌群的多样性,增加有益菌的相对丰度,减少肠道菌群的有害代谢产物,从而改变宿主的生理和病理状态,将成为健康食品产业发展的趋势和热点。
[1] RIAZ RAJOKA M S,SHI J,MEHWISH H M,et al.Interaction between diet composition and gut microbiota and its impact on gastrointestinal tract health[J].Food Science and Human Wellness,2017,6(3):121-130.
[2] FLINT H J,DUNCAN S H,LOUIS P.The impact of nutrition on intestinal bacterial communities [J].Current Opinion in Microbiology,2017,38:59-65.
[3] LI C.Understanding interactions among diet,host and gut microbiota for personalized nutrition[J].Life Sciences,2023,312:121265.
[4] GREEN J M,BARRATT M J,KINCH M,et al.Food and microbiota in the FDA regulatory framework[J].Science,2017,357(6346):39-40.
[5] BARRATT M J,LEBRILLA C,SHAPIRO H Y,et al.The gut microbiota,food science,and human nutrition:A timely marriage[J].Cell Host & Microbe,2017,22(2):134-141.
[6] JIANG X Q,LI X,YANG L S,et al.How microbes shape their communities? A microbial community model based on functional genes[J].Genomics Proteomics & Bioinformatics,2019,17(1):91-105.
[7] LIU Y X,QIN Y,CHEN T,et al.A practical guide to amplicon and metagenomic analysis of microbiome data[J].Protein & Cell,2021,12(5):315-330.
[8] CLEMENTE J C,URSELL L K,PARFREY L W,et al.The impact of the gut microbiota on human health:An integrative view[J].Cell,2012,148(6):1258-1270.
[9] WEISBURG W G,BARNS S M,PELLETIER D A,et al.16S ribosomal DNA amplification for phylogenetic study[J].Journal of Bacteriology,1991,173(2):697-703.
[10] CHENG T,XU C,LEI L,et al.Barcoding the kingdom plantae:New PCR primers for ITS regions of plants with improved universality and specificity[J].Molecular Ecology Resources,2016,16(1):138-149.
[11] SCHLOSS P D,HANDELSMAN J.Introducing DOTUR,a computer program for defining operational taxonomic units and estimating species richness[J].Applied and Environmental Microbiology,2005,71(3):1501-1506.
[12] GILBERT J A,DUPONT C L.Microbial metagenomics:Beyond the genome[J].Annual Review of Marine Science,2011,3:347-371.
[13] KANG D W D,LI F,KIRTON E,et al.MetaBAT 2:An adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies[J].PeerJ,2019,7:e7359.
[14] NISSEN J N,JOHANSEN J,ALLESOE R L,et al.Improved metagenome binning and assembly using deep variational autoencoders[J].Nature Biotechnology,2021,39(5):555-560.
[15] LANGILLE M G I,ZANEVELD J,CAPORASO J G,et al.Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences[J].Nature Biotechnology,2013,31(9):814.
[16] XU Z J,MALMER D,LANGILLE M G I,et al.Which is more important for classifying microbial communities:Who's there or what they can do?[J].Isme Journal,2014,8(12):2357-2359.
[17] NING J,BEIKO R G.Phylogenetic approaches to microbial community classification [J].Microbiome,2015,3(1):47.
[18] QUINN T P,ERB I,RICHARDSON M F,et al.Understanding sequencing data as compositions:An outlook and review [J].Bioinformatics,2018,34(16):2870-2878.
[19] VIEIRA-SILVA S,SABINO J,VALLES-COLOMER M,et al.Quantitative microbiome profiling disentangles inflammation-and bile duct obstruction-associated microbiota alterations across PSC/IBD diagnoses[J].Nature Microbiology,2019,4(11):1826-1831.
[20] ALTMAN N,KRZYWINSKI M.The curse(s)of dimensionality [J].Nature Methods,2018,15(6):399-400.
[21] HU T,GALLINS P,ZHOU Y H.A zero-inflated beta-binomial model for microbiome data analysis[J].Stat,2018,7(1):e185.
[22] LIU K,BELLET A.Escaping the curse of dimensionality in similarity learning:Efficient Frank-Wolfe algorithm and generalization bounds[J].Neurocomputing,2019,333:185-199.
[23] COSTEA P I,ZELLER G,SUNAGAWA S,et al.A fair comparison[J].Nature Methods,2014,11(4):359.
[24] PENG H C,LONG F H,DING C.Feature selection based on mutual information:Criteria of maxdependency,max-relevance,and min-redundancy[J].Ieee Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238.
[25] DITZLER G,MORRISON J C,LAN Y M,et al.Fizzy:Feature subset selection for metagenomics[J].Bmc Bioinformatics,2015,4(16):358.
[26] WANG Y,ZHOU Y H,LI Y X,et al.An improved dimensionality reduction method for metatranscriptome indexing based diseases classification[J].BMC Systems Biology,2012,6 Suppl 3(Suppl 3):S12.
[27] OH M,ZHANG L Q.DeepMicro:Deep representation learning for disease prediction based on microbiome data[J].Scientific Reports,2020,10(1):6026.
[28] WEISS S,XU Z Z,PEDDADA S,et al.Normalization and microbial differential abundance strategies depend upon data characteristics [J].Microbiome,2017,5(1):27.
[29] NEARING J T,DOUGLAS G M,HAYES M G,et al.Microbiome differential abundance methods produce different results across 38 datasets[J].Nature Communications,2022,13(1):342.
[30] MARCOS -ZAMBRANO L J,KARADUZOVIC -HADZIABDIC K,TURUKALO T L,et al.Applications of machine learning in human microbiome studies:A review on feature selection,biomarker identification,disease prediction and treatment [J].Frontiers in Microbiology,2021,12:634511.
[31] GUPTA M M,GUPTA A.Survey of artificial intelligence approaches in the study of anthropogenic impacts on symbiotic organisms -A holistic view[J].Symbiosis,2021,84(3):271-283.
[32] STATNIKOV A,HENAFF M,NARENDRA V,et al.A comprehensive evaluation of multicategory classification methods for microbiomic data[J].Microbiome,2013,1(1):11.
[33] PASOLLI E,TRUONG D T,MALIK F,et al.Machine learning Meta-analysis of large metagenomic datasets:Tools and biological insights[J].Plos Computational Biology,2016,12(7):e1004977.
[34] MANTAS C J,CASTELLANO J G,MORAL -GARCÍA S,et al.A comparison of random forest based algorithms:Random credal random forest versus oblique random forest[J].Soft Computing,2019,23(21):10739-10754.
[35] WIRBEL J,PYL P T,KARTAL E,et al.Metaanalysis of fecal metagenomes reveals global microbial signatures that are specific for colorectal cancer[J].Nature Medicine,2019,25(4):679-689.
[36] JIANG P Z,WU S C,LUO Q B,et al.Metagenomic analysis of common intestinal diseases reveals relationships among microbial signatures and powers multidisease diagnostic models[J].mSystems,2021,6(3):e00112-21.
[37] LI M,LIU J,ZHU J,et al.Performance of gut microbiome as an independent diagnostic tool for 20 diseases:Cross-cohort validation of machine-learning classifiers[J].Gut Microbes,2023,15(1):2205386.
[38] LIU Y L,ZHU J L,WANG H C,et al.Machine learning framework for gut microbiome biomarkers discovery and modulation analysis in large -scale obese population[J].BMC Genomics,2022,23(1):850.
[39] CHU Y,SUN S,HUANG Y,et al.Metagenomic analysis revealed the potential role of gut microbiome in gout[J].npj Biofilms and Microbiomes,2021,7(1):66.
[40] LEIBOVITZH H,LEE S H,XUE M Y,et al.Altered gut microbiome composition and function are associated with gut barrier dysfunction in healthy relatives of patients with Crohn's disease[J].Gastroenterology,2022,163(5):1364.
[41] WIRBEL J,ZYCH K,ESSEX M,et al.Microbiome Meta-analysis and cross-disease comparison enabled by the SIAMCAT machine learning toolbox[J].Genome Biology,2021,22(1):93.
[42] HUIJUN W,WANGLONG G,CHANG S,et al.Association of gut microbiota with glycaemic traits and incident type 2 diabetes,and modulation by habitual diet:A population-based longitudinal cohort study in Chinese adults[J].Diabetologia,2022,65(7):1145-1156.
[43] COSTELLO E K,LAUBER C L,HAMADY M,et al.Bacterial community variation in human body habitats across space and time[J].Science,2009,326(5960):1694-1697.
[44] PORRAS A M,SHI Q J,ZHOU H,et al.Geographic differences in gut microbiota composition impact susceptibility to enteric infection[J].Cell Reports,2021,36(4):109457.
[45] MARCOS -ZAMBRANO L J,KARADUZOVIC -HADZIABDIC K,LONCAR TURUKALO T,et al.Applications of machine learning in human microbiome studies:A review on feature selection,biomarker identification,disease prediction and treatment[J].Front Microbiol,2021,12:634511.
[46] MUJAGIC Z,KASAPI M,JONKERS D,et al.Integrated fecal microbiome-metabolome signatures reflect stress and serotonin metabolism in irritable bowel syndrome[J].Gut Microbes,2022,14(1):2063016.
[47] DEL CHIERICO F,NOBILI V,VERNOCCHI P,et al.Gut microbiota profiling of pediatric nonalcoholic fatty liver disease and obese patients unveiled by an integrated Meta-omics-based approach[J].Hepatology,2017,65(2):451-464.
[48] KOSTIC A D,GEVERS D,SILJANDER H,et al.The dynamics of the human infant gut microbiome in development and in progression toward Type 1 diabetes[J].Cell Host & Microbe,2015,17(2):260-273.
[49] XU X L,XIE Z M,YANG Z Y,et al.A t-SNE based classification approach to compositional microbiome data[J].Frontiers in Genetics,2020,11:620143.
[50] ARMSTRONG G,MARTINO C,RAHMAN G,et al.Uniform manifold approximation and projection(UMAP)reveals composite patterns and resolves visualization artifacts in microbiome data[J].Msystems,2021,6(5):e0069121.
[51] LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521(7553):436-444.
[52] OUDAH M,HENSCHEL A.Taxonomy-aware feature engineering for microbiome classification [J].BMC Bioinformatics,2018,19(1):1-13.
[53] NGUYEN T H,CHEVALEYRE Y,PRIFTI E,et al.Deep learning for metagenomic data:Using 2D embeddings and convolutional neural networks [C].California:31st Conference on Neural Information Processing Systems(NIPS 2017),2017.
[54] REIMAN D,FARHAT A M,DAI Y.Predicting host phenotype based on gut microbiome using a convolutional neural network approach[J].Artificial Neural Networks,2021,2190:249-266.
[55] REIMAN D,METWALLY A A,SUN J,et al.PopPhy-CNN:A phylogenetic tree embedded architecture for convolutional neural networks to predict host phenotype from metagenomic data [J].IEEE Journal of Biomedical and Health Informatics,2020,24(10):2993-3001.
[56] SHEN W X,LIANG S R,JIANG Y Y,et al.Enhanced metagenomic deep learning for disease prediction and consistent signature recognition by restructured microbiome 2D representations [J].Patterns,2023,4(1):100658.
[57] OH M,ZHANG L Q.DeepGeni:Deep generalized interpretable autoencoder elucidates gut microbiota for better cancer immunotherapy[J].Scientific Reports,2023,13(1):4599.
[58] WANG F,YANG H,WU Y,et al.SAELGMDA:Identifying human microbe– disease associations based on sparse autoencoder and LightGBM[J].Frontiers in Microbiology,2023,14:1207209.
[59] GAO X,ZHAO J,CHEN W,et al.Food and drug design for gut microbiota-directed regulation:Current experimental landscape and future innovation[J].Pharmacol Res,2023,194:106867.
[60] MA Y,GUO Z,XIA B,et al.Identification of antimicrobial peptides from the human gut microbiome using deep learning[J].Nat Biotechnol,2022,40(6):921-931.
[61] IDDRISU I,MONTEAGUDO-MERA A,POVEDA C,et al.Malnutrition and gut microbiota in children[J].Nutrients,2021,13(8):2727.
[62] SMITH M I,YATSUNENKO T,MANARY M J,et al.Gut microbiomes of malawian twin pairs discordant for Kwashiorkor[J].Science,2013,339(6119):548-554.
[63] BLANTON L V,CHARBONNEAU M R,SALIH T,et al.Gut bacteria that prevent growth impairments transmitted by microbiota from malnourished children[J].Science,2016,351(6275):10.1126/science.aad3311 aad3311.
[64] GEHRIG J L,VENKATESH S,CHANG H W,et al.Effects of microbiota-directed foods in gnotobiotic animals and undernourished children [J].Science,2019,365(6449):139.
[65] CHEN R Y,MOSTAFA I,HIBBERD M C,et al.A microbiota-directed food intervention for undernourished children [J].New England Journal of Medicine,2021,384(16):1517-1528.
[66] NATHAN D M,DAVIDSON M B,DEFRONZO R A,et al.Impaired fasting glucose and impaired glucose tolerance:Implications for care[J].Diabetes Care,2007,30(3):753-759.
[67] GRUNDY S M.Pre-diabetes,metabolic syndrome,and cardiovascular risk[J].J Am Coll Cardiol,2012,59(7):635-643.
[68] ZEEVI D,KOREM T,ZMORA N,et al.Personalized nutrition by prediction of glycemic responses[J].Cell,2015,163(5):1079-1094.
[69] BEN-YACOV O,GODNEVA A,REIN M,et al.Personalized postprandial glucose response-targeting diet versus mediterranean diet for glycemic control in prediabetes[J].Diabetes Care,2021,44(9):1980-1991.
[70] BEN-YACOV O,GODNEVA A,REIN M,et al.Gut microbiome modulates the effects of a personalised postprandial -targeting(PPT)diet on cardiometabolic markers:A diet intervention in pre-diabetes[J].Gut,2023,72(8):1486-1496.
[71] GATES A J,HUGHES R O,SHARP S R,et al.Properties of the periplasmic nitrate reductases from Paracoccus pantotrophus and Escherichia coli after growth in tungsten-supplemented media[J].FEMS Microbiology Letters,2003,220(2):261-269.
[72] ZHU W H,WINTER M G,BYNDLOSS M X,et al.Precision editing of the gut microbiota ameliorates colitis[J].Nature,2018,553(7687):208.
[73] DE PRETER V,JOOSSENS M,BALLET V,et al.Metabolic profiling of the impact of oligofructose-enriched inulin in Crohn's disease patients:A doubleblinded randomized controlled trial[J].Clinical and Translational Gastroenterology,2013,4(1):e30.
[74] BAUER E,THIELE I.From metagenomic data to personalized in silico microbiotas:Predicting dietary supplements for Crohn's disease[J].npj Systems Biology and Applications,2018,4:27.
[75] JIE Z Y,XIA H H,ZHONG S L,et al.The gut microbiome in atherosclerotic cardiovascular disease[J].Nat Commun,2017,8(1):845.
[76] WANG Z,ROBERTS A B,BUFFA J A,et al.Non-lethal inhibition of gut microbial trimethylamine production for the treatment of atherosclerosis [J].Cell,2015,163(7):1585-1595.
[77] CHENG L,QI C L,ZHUANG H,et al.gutMDisorder:A comprehensive database for dysbiosis of the gut microbiota in disorders and interventions[J].Nucleic Acids Res,2020,48(D1):D554-D560.
[78] QIAO S S,LIU C,SUN L,et al.Gut Parabacteroides merdae protects against cardiovascular damage by enhancing branched -chain amino acid catabolism [J].Nature Metabolism,2022,4(10):1271-1286.
[79] LI X L,CUI J J,ZHENG W S,et al.Bicyclol alleviates atherosclerosis by manipulating gut microbiota[J].Small,2022,18(9):2105021.
[80] KARAKAN T,GUNDOGDU A,ALAGOZLU H,et al.Artificial intelligence-based personalized diet:A pilot clinical study for irritable bowel syndrome[J].Gut Microbes,2022,14(1):2138672.
[81] MICHALAK L,GABY J C,LAGOS L,et al.Microbiota-directed fibre activates both targeted and secondary metabolic shifts in the distal gut[J].Nature Communications,2020,11(1):5773.
[82] CHEN P B,BLACK A S,SOBEL A L,et al.Directed remodeling of the mouse gut microbiome inhibits the development of atherosclerosis[J].Nature Biotechnology,2020,38(11):1288.
Accurate Dietary Intervention Targeting Gut Microbiota