导读
坏死性小肠结肠炎(Necrotizingenterocolitis,NEC)是一种肠道炎症疾病,可发展为肠坏死、败血症,并能造成婴儿死亡,但病因尚不明确。Scienceadvances最近的研究,招募名早产儿,分别对患坏死性小肠结肠炎婴儿和未患病婴儿的肠道菌群进行了宏基因组分析,并用细菌复制速率、KEGG模块、次级代谢物基因簇等特征进行机器学习,鉴定出坏死性小肠结肠炎发生相关的可能因素,其中细菌增长速率为最强的预测因子。本研究结果或可用于坏死性小肠结肠炎的早期诊断及之后的微生物靶向治疗。
点击文末“阅读原文”,可转至文献下载页面
文献ID
题目:Necrotizingenterocolitisisprecededbyincreasedgutbacterialreplication,Klebsiella,andfimbriae-encodingbacteria
译名:坏死性小肠结肠炎发生前,肠道菌复制率增大,克雷伯氏菌属和编码菌毛细菌增多
发表期刊:《Scienceadvances》
发表时间:年12月IF:12.
通讯单位:美国加州大学伯克利分校
通讯作者:JillianF.Banfield
检索:10./sciadv.aax
材料内容
本研究分析了34例发生坏死性小肠结肠炎(Necrotizingenterocolitis,NEC)的早产儿和例未发生NEC的早产儿的个粪便宏基因组(图1)。大部分样本来自出生后的第一个月,平均每个婴儿7.2个样本用于测序,总共产生4.6T的宏基因组数据。对所有样本进行了广泛的计算分析,以重新恢复基因组,并确定它们的系统发育、代谢潜力和复制率(iRepindexofreplication,iRep)。此外研究了真核病毒,毒力因子,次级代谢物基因簇,以及先前涉及的病原体(图1)。由于NEC是一种快速发展的疾病,对于大多数统计测试,将NEC样本定义为在NEC诊断前2天内采集的样本(pre-NEC)。对于没有发生NEC的婴儿,只使用与NEC发病相关时期的一个样本(对照样本)。pre-NEC和对照样本与出生天数(DOL)、妊娠年龄和抗生素使用情况相匹配(图1C)。
图1来自名早产儿的个样本的宏基因组特征。(A)宏基因组学与基因组解析宏基因组学的示意图。(B)使用无数据库和数据库依赖的方法对宏基因组进行特征描述。(C)纳入本研究的名早产儿的流程图。
研究成果
1、肺炎克雷伯菌在NEC患儿中富集
所有婴儿肠道菌群均以变形杆菌为主,与NEC无关(图2A和2B)。与以往对足月婴儿的研究相比,本研究中早产儿肠杆菌科增加(医院致病菌属于变形杆菌科),放线菌和拟杆菌的丰度明显降低。可能影响这些微生物的因素包括:所有早产婴儿在出生时服用预防性抗生素、剖宫产率高、配方奶喂养占优势、肠道和免疫系统不成熟。与对照组相比,NEC患儿的肠道菌群没有肠杆菌科的显著富集(P=0.15),因此肠杆菌科与NEC患儿的整体联系可能是由于这些细菌在给予NEC抗生素后增殖所致。
基于加权UniFrac距离进行PCA分析,比较所有时间点所有样本的微生物群落(图2B)。前两个主成分解释了总方差的73%,但NEC婴儿(红点)样本并没有与对照组婴儿(黑点)单独聚类。考虑到较高的主成分(直到第5个主成分),并没有将pre-NEC和对照样本分开,并且由临床宏数据编码的样本也没有聚在一起。
为了鉴定在pre-NEC样品中富集的菌株,研究者计算了pre-NEC样本和对照样本中组装的细菌、噬菌体和质粒基因组的百分比(图2C和2D)。肺炎克雷伯菌株_2与NEC的相关性最大,在52%的pre-NEC样本和23%的对照样本中均高于检测阈值(P=0.)。与此密切相关的细菌(平均核苷酸鉴定(ANI)99%)在所有婴儿中最多可定植35%(图2C)。医院相关细菌在多个婴儿中定植的结果。
图2NEC与非NEC早产儿微生物比较。(A)诊断为NEC和未被诊断为NEC的婴儿微生物组成情况。(B)基于加权UniFrac距离的PCA分析。(C和D)NEC婴儿和非NEC婴儿中(C)细菌或(D)噬菌体(金色)和质粒(蓝色)定植的比例。
2、NEC前细菌复制率较高
通过测定复制起点和终点的DNA测序覆盖率的差异,从宏基因组数据测量细菌复制率,得到与传统倍增时间测量相关的iRep值。在DOL、孕龄和近期使用抗生素情况相似的队列中,pre-NEC组的细菌iRep值明显高于对照组(P=0.)(图3)。此外,iRep值与NEC诊断之间遵循一个显著的模式:在NEC诊断前4天或更长的时间内,细菌复制是稳定的,在诊断前3天内每天增加,在诊断后iRep值急剧下降(可能由于随后的抗生素使用)(图3A)。此外,肠杆菌科的基因组显示出pre-NECiRep值比细菌整体更高(图3A和3B)。在pre-NEC,细菌复制的增加可能会促进疾病的发生,或者仅仅是肠道环境变化导致NEC的一种反应。
图3细菌复制率在NEC诊断前明显较高。(A)细菌组相对于NEC诊断日的复制率。(B)对照样品(白色)与pre-NEC样品(灰色)的生长速率。
3、机器学习确定了NEC和对照案例之间的其他区别
为了评估pre-NEC和对照样本之间哪些特征不同,研究者开发了一个机器学习(ML)分类器。对所有个特征进行训练,预测样本是pre-NEC还是对照样本,通过交叉验证超过次迭代来测量准确性。在平衡集上,分类器的中位数精度达到64%,比随机结果好14%。虽然这种准确性的分类器在临床应用中可能是有限的,但它使我们能够询问哪些特征对区分pre-NEC和对照样本最有帮助。
ML分类器使用的最重要的个体特征是复制率(iRep值)、KEGG模块、次级代谢物基因簇和整体质粒丰度(图4)。特定细菌类群的iRep值和整体的iRep中值是一些最重要的特征(图4B),而KEGG模块占总特征重要性的50%以上(图4A)。数量相似的KEGG模块与NEC相关或非相关(图4C),但与NEC相关的模块(如赤藓糖醇和半乳糖醇转运系统)和与NEC非相关模块(如钠和荚膜多糖转运系统)与疾病无明显关系。次级代谢物基因簇是第二重要的分类(图4A),但与KEGG模块不同,很少有与NEC非相关的(图4C)。最重要的次生代谢物基因簇编码了在克雷伯氏菌中发现的生物合成基因操纵子(cluster)。在其他物种中,类似操纵子参与群体感应丁内酯的生物合成。第二重要的基因簇出现在肠球菌中,并参与一种类似亚替洛辛A1的活性肽的生物合成(cluster)。亚替洛辛A1是一种已知具有溶血活性的抗菌剂。另一个具有高度特征的、重要性的隐性次级代谢物基因簇(cluster)与产肠毒素的产气荚膜梭菌的质粒密切相关,该质粒邻近肠毒素基因(cpe)和β2毒素基因(cpb2)。总体而言,高质粒丰度与pre-NEC样品相关(图4B),尤其是肺炎链球菌质粒在pre-NEC样品中显著丰富(P=0.03)。在pre-NEC样品中肺炎链球菌的富集(图2C)可以解释这些样品中肺炎链球菌质粒的高丰度。
每个菌株根据其基因组编码的KEGG模块的重要性得分总和,被赋予一个重要值。生成所有基因组重要性得分的直方图,并确定个基因组的KEGG重要性值高于典型分布(以下称为“感兴趣的微生物”)。与对照样品相比,在pre-NEC样品中感兴趣的微生物明显更多(P=0.)(图4D),并且它们在系统发育上聚集在一起(图4F)。其中,肠杆菌科占97%,克雷伯菌属占90%。
图4ML识别pre-NEC和对照样品之间的差异。A)每个特征类别的所有单独重要性的总和。(B)与NEC相关的所有个体特征的重要性,分类器的重要性超过1%。(C)所有个体KEGG模块(顶部,红色)和次级代谢物簇(底部,蓝色)的重要性。负值与pre-NEC样本呈负相关,正值与pre-NEC样本呈正相关。(D和E)重要KEGG模块富集的基因组相对丰度(D)和pre-NEC与对照重要次生代谢富集基因组相对丰度(E)。(F)细菌基因组的系统发育树周围重要KEGG模块(红星)和重要次级代谢物簇(蓝星)中富集的基因组的分布。
ML分类器将个与pre-NEC样品显著相关的次级代谢产物生物合成基因簇鉴定为有重要性(图4E)。在这些基因组中富集了几种类型的次生代谢物基因簇(P0.01),包括抗菌肽、细菌素和丁内酯(分别由、和11个基因组编码)。与感兴趣的微生物相反,这些细菌散布在系统发育树周围(图4F)。这可能表明,集群本身与pre-NEC样本有关。总的来说,结果表明群体感应和抗菌肽的产生与NEC发病有关。
4、与NEC相关的编码菌毛细菌
利用基因组解析宏基因组学提供的基因内容信息,寻找与(i)pre-NEC样本和(ii)感兴趣的微生物相关的蛋白。根据混合马尔科夫聚类算法产生了,个蛋白质簇,这些簇在统计上都不与NEC相关(图5A)。然而,85个蛋白簇与感兴趣的微生物相关,且具有较高的精确度(0.7)(图5B)。这些簇最常见的蛋白家族(pFam)注释是菌毛和三磷酸腺苷结合(ABC)转运蛋白。然而,只有编码菌毛蛋白的基因组与NEC有显著的相关性(P=0.02)。
将菌毛操纵子与公共数据库进行比较,发现大多数编码分子伴侣引导(chaperone-usher,CU)型菌毛。提出了基于usher蛋白pFam的UC分类方案[PF.19]。根据氨基酸序列的身份将测序数据中鉴定的32,个usher蛋白分组,10个最普遍的组被放置在一个系统发育树中,参考序列来自每个CU菌毛亚型(图5D)。10个菌毛cluster都符合已建立的CU菌毛分类,10个cluster中有9个属于CU菌丛的γ大分枝,1个属于π分枝(图5D)。本研究中鉴定的4个菌毛cluster在pre-NEC样品中显著丰富,编码cluster49(4clade)的基因组在pre-NEC样品中也显著具有较高的iRep值(图5C)。编码菌毛cluster49的27个基因组未被确定为感兴趣的基因组,但考虑到NEC与对照组婴儿的所有样本,它们的丰度显著更高,iRep值显著更高(P0.01)。这表明,菌毛cluster49本身可能与NEC有关,而不是偶然地与代谢重要基因组有关。
图5菌毛编码基因与NEC发展相关。(A和B)蛋白簇与pre-NEC样本(A)和相关微生物(B)的关联。每个点代表一个蛋白簇。Recall是(A)pre-NEC样本的数量,集群在/pre-NEC样本的总数和(B)感兴趣微生物的数量,集群在/感兴趣的生物体的总数。(C)每个菌群编码的细菌基因组数目、每个菌群编码的基因组物种水平的系统发育概况以及每个菌群与NEC的关联。(D)利用IQtree构建CU蛋白的系统发育树。颜色表示参考序列所跨越的系统发育宽度,而星星则代表新生的CU分枝。
5、具有诊断价值的NEC生物标记物
统计检验发现四个与pre-NEC样本(样本NEC诊断前2天内)显著相关的因素:整体iRep值(图3B),基因组编码特定类型的次生代谢物基因集群(抗菌肽、细菌素和丁内酯),克雷伯氏菌(图2C),菌毛cluster49(图5C)。在NEC诊断前8天,每天都进行类似的分析(图6)。在NEC样本中,编码特定类型次级代谢物基因簇和克雷伯氏菌基因组的基因组数量总是显著地更多,尽管这种差异的效应大小更接近于NEC诊断。另一方面,在诊断前3天和前1天,iRep值和编码菌毛cluster49的基因组丰度分别显著升高。
图6NEC的生物标志物最接近NEC诊断
研究结论
1、与健康组相比,NEC组肺炎克雷伯菌丰度更高,NEC确诊前细菌复制率更快,特别是肠杆菌科;
2、机器学习发现,NEC组中克雷伯氏属、编码菌毛蛋白细菌及含次级代谢物基因簇(细菌素、与群体感应相关的丁内酯)的细菌增多;
3、以上发现或可用于NEC早期诊断及微生物靶向治疗。
公司介绍
上海锐翌生物科技有限公司成立于年10月,是一家专业从事基因科技及健康服务的国家高新技术企业。锐翌生物依托高通量测序技术平台,专注于人体微生物组前沿技术和研究成果在基础科研领域的突破,以及在医学上的转化应用。助力高等院校、医院的科研工作者多角度、全面地探究和解决科学问题,助力更多优质科研成果发表。同时,在大肠癌早期筛查、临床病原宏基因组检测和健康管理等精准医疗领域开发检测技术及应用方案,致力于为医疗机构提供疾病早期检测和健康综合管理服务,目前已和全国医院达成深度合作。
公司于年获评“上海闵行十大科技创业新锐”企业称号,目前已在杭州、青岛、济南、贵阳等地成立区域中心。其中,济南医学检验所于年被授予“国家基因检测技术应用示范中心”称号,青岛医学检验所于年9月投入使用。
点击下方“阅读原文”
转至文献下载页面