logo

logo

产品服务

Sequencing services

  • 首页代谢组与宏基因组关联分析

代谢组与宏基因组关联分析

微生物组的研究已经逐渐进入到多组学的时代,越来越多的科学家将代谢组与微生物组关联起来,同时从微生物与代谢物两个角度分析生物学问题,通过解析微生物-代谢物的关联性,多维的角度揭示生命活动。

华大基因针对宏基因组及代谢组的特征数据差异物种及差异代谢物进行整合分析——对于差异代谢物及差异代谢物分别进行定量关联分析及功能关联分析,对于提供连续表型的数据,还进行差异物种,差异代谢物和表型之间的关联分析,以探究微生物、代谢物和表型的内在关系。

 

技术优势

关联分析研究经验丰富,在Nature 等顶级期刊上自主发表多篇文献。

充分调研微生物组与代谢组关联分析文献,自主开发软件分析流程。

 

产品应用

1、  肠道微生物与疾病研究

2、  脑-肠-轴研究

3、  益生菌等微生物制剂开发

4、  根际微生物研究

5、  水体、土壤等环境研究

6、  茶叶、腐乳等发酵食品发酵工艺探索

 

技术路线

 1

项目周期

12个自然日     

 


案例一:代谢组学联合宏基因组学对汉族人群肥胖机制进行研究[1]

研究背景:

肠道微生物的组成和变化会受到许多因素的影响,比如年龄和饮食,然而还有一个平时可能被大家所忽略的因素就是种族。因此,这项以中国汉族年轻人为样本的研究,对我国肠道微生物与肥胖研究领域来说有着十分重要的意义。本研究由上海交通大学瑞金医院和华大基因共同完成。研究人员以中国的汉族年轻人为研究对象,确定了一个能抑制肥胖的肠道微生物——多形拟杆菌,还研究了其对代谢产物氨基酸水平的影响。

 

技术路线:

1

图1 技术路线图

 

主要结论:

肥胖志愿者的拟杆菌属细菌大量减少,是因为代谢产物芳香族氨基酸(AAA)以及支链氨基酸(BCAA)的增加;这两类氨基酸在过去的研究中已经被证明与II型糖尿病的发生发展有关。

肥胖人群中谷氨酸的含量非常高,与苗条人群的差异也最大,而且在肥胖人群中,它的含量与多形拟杆菌的数量呈反比。

多形拟杆菌、谷氨酸含量与肥胖的关系进一步在小鼠模型和人体中进行了确认。

2

图2 协变量分析CIA和典范对应分析CCA

a实验和对照组间217个MLGs和148个代谢物丰度变化协变量分析;b实验组和对照组富集的217个MLGs和22个差异表达氨基酸进行典范对应分析CCA。

 

案例二:肠道菌群代谢与HIV感染炎症之间的相互作用[2]

研究背景:

HIV感染导致肠道相关淋巴组织的破坏,使得肠道菌群的组成发生变化。但目前还缺乏关于HIV感染如何影响微生物与宿主之间相互作用的研究。本文结合宏基因组和宏转录组数据来研究HIV相关微生物的功能修饰。结果表明,HIV相关微生物一方面很好地适应炎症环境,例如抗氧化应激反应通路的高表达、抗炎反应过程的低表达,另一方面促进肠道炎症的发生发展。本文通过共发生网络和代谢网络,分析了群落结构中物种标记物和代谢标记物的相关性。通过贝叶斯网络,发现了维持群落结构稳定性的关键通路。此外,确定了群落中各物种对代谢活动的贡献,以及各物种和宿主健康的相互作用。

 

研究对象:病毒血症患者12例(VU=12),免疫应答者18例(IR =18),免疫无应答者9例(INR=9),以及未感染HIV的健康对照15例(HIV-=15)。

主要发现:

HIV+组和HIV-组样本中KO基因含量的差异性很大。HIV+样本菌群表现为促炎症反应通路(ko00540、ko05111、ko05120)的增加,抗氧化应激反应通路(ko00250、ko00908)的增加,而信号转导和膜转运通路的减少。HIV+样本菌群表现为Prevotella、Acidaminococcus、Streptococcus等菌属的增加,而Bacteroides、Bifidobacterium、Akkermansia、Odoribacter、Alistipes等菌属的减少。

宏转录组数据结果表明,HIV+组和HIV-组样本中RNA-KO基因含量的差异性很大。HIV+样本菌群表现为应激反应通路(ko04141、ko00521、ko00730、ko00053)的转录本丰度增加,而抗炎症代谢过程(ko00650、ko00640、ko00071)的丰度减少。基于宏转录组数据的物种注释结果,HIV+样本菌群表现为Prevotella、Acidaminococcus、Coprobacillus、Streptococcus等菌属的增加。这些被认为是转录活跃细菌。

使用广义线性模型GLM分析,发现HIV+组中细菌物种标记物与通路标记物为正相关。发现物种标志物提供了涉及其相关代谢通路的基因,而且普氏菌属各个菌种都提供了涉及HIV相关通路的基因,表明普氏菌属在HIV发病过程中的重要作用。

物种关系网络图产生了20个模块,各模块都包含3个以上物种,最大模块包含34个物种。大多数模块的主导细菌为厚壁菌门与拟杆菌门,少数模块的主导细菌为放线菌门和变形菌门。结果还发现,如果模块中包含双歧杆菌属(放线菌门),则该模块中不存在变形菌门,推测放线菌门和变形菌门有竞争关系。

 

参考文献

[1] Liu, Ruixin, et al. "Gut microbiome and serum metabolome alterations in obesity and after weight-loss intervention." Nature medicine 23.7 (2017): 859.

[2] Vázquez-Castellanos, Jorge F., et al. "Interplay between gut microbiota metabolism and inflammation in HIV infection." The ISME journal 12.8 (2018): 1964-1976.

 


代谢组与宏基因组关联分析首先将属于两组学的特征数据被挖掘出来,并依据特征数据的不同将分析流程分为三大模块——定量关联、功能关联及表型关联模块,分层次对数据进行深入挖掘,分别从表达量、功能及与表型的相关程度对两组学数据进行全面解读。

以下为部分分析结果图片展示:

 0


1、  适用数据类型

要求用于关联分析的两组学的样本数据一一对应(即用于关联分析的两组学的样本来自于相同的生物学重复个体),代谢组数据可以为非靶向代谢组、脂质组学、靶向代谢组学中的任意一种。

 

2、  重复次数要求

1)当样本为2组时,每组样本数不少于8个;当样本组不少于3组时,每组样本不少于6个;每组样本大于10个时分析效果较好;

2)用于关联分析的临床样本推荐每组样本数不少于30个;

3)重复数少于建议数时分析效果差(样本总数少会导致WGCNA降维效果差,而重复数少则导致相关性分析统计不可靠,后续分析流程收到影响);每组低于3个样本时无法分析。

 


Q1:为什么用于关联分析的两组学样本要求一一对应?

A1: 分析中包含Spearman相关性分析,其相关系数表明X(独立变量)和Y(依赖变量)的相关方向,在进行计算两组学的相关性时要求每一个组学数据要有能够对应的另一个组学数据,否则无法进行相关性分析。

 

Q2:宏基因组+代谢关联分析对用于采集数据的样本有限制吗?

A2:没有限制。此关联分析针对宏基因组及代谢组数据,满足条件的数据即可进行相应的关联分析,根据解读关联分析的结果进行数据挖掘,因此要求在前期设计实验时就要考虑到后面用于关联分析的两组学数据的样本来源在生物学上的相关性(一般建议用于关联分析的两组学数据来源于相同的生物学重复的个体),单纯的数据分析本身只讨论统计学的相关性。

 

Q3:对于关联分析的两组学数据的重复数的要求有什么依据吗?

A3:建议数是我们的项目经验值,当重复数低于建议数时,数据分析的表现结果较差(样本总数少会导致WGCNA降维效果差,而重复数少则导致相关性分析统计不可靠,后续分析流程收到影响);且每组低于3个样本时无法进行关联分析。


深圳华大科技(总部)

电话:400-706-6615
邮箱:info@genomics.cn