logo

logo

产品服务

Sequencing services

代谢全谱

       代谢组学(Metabonomics/Metabolomics)是继基因组学和蛋白质组学之后新兴发展起来的学科,其主要目标是定量地研究生命体对外界刺激、生理病理变化以及基因突变而产生的体内代谢物水平的多元动态反应,其研究对象是相对分子质量 1000 DA以内的小分子物质,如脂类、酮类、有机酸等。

       代谢全谱分析采用液相色谱-质谱联用采集样品的代谢物质谱图,比较不同组样品代谢产物的含量,寻找差异代谢物,并探索差异代谢物之间的代谢通路。可用于生物标志物的发现,中医药研究,疾病诊断等等。根据研究对象的不同,代谢全谱分析主要分为常规代谢组和脂质代谢组。常规代谢组的研究对象是机体内全部的代谢物,希望能够尽可能全面地覆盖到更多的代谢物种类,包括羟基酸、氨基酸、糖类、脂类、有机酸等;脂质代谢组的研究对象主要是脂类物质,包括脂肪酸、甘油糖脂、甘油磷脂、鞘脂、固醇脂类、苯酚脂类等。

产品优势

屏幕快照 2018-05-10 上午9

产品应用

屏幕快照 2018-05-10 上午9

技术路线

屏幕快照 2018-05-10 上午10

信息分析

1标准信息分析

1.1数据预处理(滤噪、峰匹配、峰提取)及归一化

1.2数据质控

•  QC样本TIC重叠图

•  QC样本PCA分析

1.3统计分析

•  单变量分析(差异倍数及T检验)

•  多变量分析(PCA,PLS-DA)

1.4差异离子筛选及鉴定(注意此处鉴定到的代谢物为质谱数据与开源数据库匹配得到候选代谢物。最终确认代谢物还需要与标准品进行匹配,最终确认代谢物不包含在此分析内)

1.5 聚类分析

1.6 候选差异代谢物Pathway注释

 

2个性化信息分析

2.1 ROC分析

2.2 代谢物相关性分析

2.3 代谢通路影响因素分析



1、代谢组学联合宏基因组学对汉族人群肥胖机制进行研究

Gut microbiome and serum metabolome alterations in obesity and after weight-loss intervention. Nature medicine. 2017

背景:肠道微生物的组成和变化会受到许多因素的影响,比如年龄和饮食,然而还有一个平时可能被大家所忽略的因素就是种族。因此,这项以中国汉族年轻人为样本的研究,对我国肠道微生物与肥胖研究领域来说有着十分重要的意义。本研究是上海交通大学瑞金医院和华大基因共同完成的。研究人员以中国的汉族年轻人为研究对象,确定了一个能抑制肥胖的肠道微生物——多形拟杆菌,还研究了其对代谢产物氨基酸水平的影响。

技术路线:

图3

主要结论:

1)肥胖志愿者的拟杆菌属细菌大量减少,是因为代谢产物芳香族氨基酸(AAA)以及支链氨基酸(BCAA)的增加;这两类氨基酸在过去的研究中已经被证明与II型糖尿病的发生发展有关。

2)肥胖人群中谷氨酸的含量非常高,与苗条人群的差异也最大,而且在肥胖人群中,它的含量与多形拟杆菌的数量呈反比。

3)多形拟杆菌、谷氨酸含量与肥胖的关系进一步在小鼠模型和人体中进行了确认

图4

图1 协变量分析CIA和典范对应分析CCA

a实验和对照组间217个MLGs和148个代谢物丰度变化协变量分析;b实验组和对照组富集的217个MLGs和22个差异表达氨基酸进行典范对应分析CCA。

图5

                            图2 差异表达代谢物的聚类分析

                              对151个样本中的148个差异表达代谢物进行聚类分析。

2、首个中国人群糖尿病相关非靶向血浆脂质组研究

Lipidomic profiling reveals distinct differences in plasma lipid composition in healthy, prediabetic and type 2 diabetic individuals. Giga Science. 2017

背景:华大与苏州疾控中心合作,研究中国2型糖尿病患者、糖尿病前期与糖耐受正常人群的血浆脂质代谢物组成及差异,并为亚洲人群的脂代谢研究提供了参考。

研究内容:

样品:114位二型糖尿病患者,81位早期糖尿病患者,98位血糖正常的人(NGT)

脂质组学:LC-MS/MS

数据分析:QI

技术路线:

图1

主要发现:

1)随机森林分析筛选出28个疾病有关离子,对其和疾病表型进行相关性分析

2)lysophosphatidylcholine (lysoPC) 和 acylcarnitine可作为二型糖尿病早期诊断biomarker。

图2

                        图3 一般线性模式对选择出的28个离子和表型进行相关性分析




1、鉴定和定量结果

本项目采用先进的质谱仪Xevo G2-XS QTOF (Waters,UK) 进行质谱数据采集,使用商业化软件Progenesis QI(version 2.2)(Waters,UK)和自主研发的代谢组学R软件包metaX[1]对质谱数据进行统计分析,其中代谢物鉴定基于数据库KEGG。

        表1 总离子数和鉴定结果

屏幕快照 2018-05-10 下午3

        表2 差异离子及鉴定结果

屏幕快照 2018-05-10 下午3

2、质控分析

QC样本在样本检测前用于平衡“色谱-质谱”系统,在样本检测过程中用于评价质谱系统的稳定性

图1

图1 QC样本TIC重叠图

TIC即总离子流图,以时间点为横坐标,以每个时间点质谱图中所有离子的强度加和为纵坐标,连续描绘得到的图谱。QC样本为同一个样本,它们TIC的重叠图可以用于初步判断仪器状态,重叠程度越高说明仪器越稳定。

图2

                  图2 QC样本主成分分析

和TIC重叠图同理,质控样本QC可以相对聚集在一起,聚集得越好表明仪器越稳定,采集的数据质量越好。X轴表示第一个主成分,Y轴表示第二个主成分。括号里的数字表示该主成分能综合原始信息的比例。

3、统计分析

1)单变量统计分析

该项目采用的是T检验和变异倍数分析(Fold change analysis,FC analysis)。在统计分析过程中,进一步对统计检验产生的p-value进行FDR校正得到q-value。最终结果以火山图(Volcano plot)形式呈现差异倍数(Fold change)和q-value两个指标,通常以差异倍数≥1.2 或≤0.8333,q-value值小于0.05作为筛选差异代谢物的条件。

图3

图3 火山图

log2(fold change)为横坐标,q-value的负对数-log10(q-value)为纵坐标。fold change小于等于0.8333或大于等于1.2且q-value值小于0.05的点标注为红色,其余点为蓝色。

2)多变量统计分析

从海量数据中发现代谢组学潜在标志物,除了单变量分析还需借助多变量统计分析方法,常用的多变量分析方法有主成分分析(PCA)和偏最小二乘法-判别分析(PLS-DA)。

图4

              图4 主成分分析模型

横坐标代表第一主成分PC1,纵坐标代表第二主成分PC2,图中每个点代表一个样品,不同颜色代表不同组别。括号里的数字表示该主成分能综合原始信息的比例。

图5

               图5 PLS-DA判别分析模型的得分图

横坐标代表第一主成分PC1,纵坐标代表第二主成分PC2。图中每个点代表一个样品,两种颜色符号的离散程度分别代表了两组样本在PC1和PC2轴上的分布趋势。

4、差异离子筛选及鉴定

该项目采用多变量分析PLS-DA模型前两个主成分的VIP值,结合单变量分析差异倍数(fold-change)和q-value值来筛选差异表达的代谢物。筛选条件: 1)VIP ≥ 1 ;2) fold change ≥1.2 或者 ≤ 0.8333 ;3) q-value < 0.05,三者取交集,得到共有的离子即差异离子。

图6

图6 差异离子聚类分析

图中的每一行代表一个差异离子,每一列代表一个样本,不同颜色表示不同的强度,颜色从绿色到红色,表示强度从低到高。


1代谢样品

一般不推荐客户送提取好的代谢物样进行检测,如果客户确已提取好了,需送代谢物样本进行预实验检测。

2代谢组织样品

                                                                                            表1 代谢组织类样品送样要求

样品类型

送样量

备注

组织(动植物)

≥100mg

总重量最低不低于50mg

酵母、霉菌类真菌和细菌等微生物

≥10mg;菌液≥20µL;细胞个数≥107

必须经过淬灭(即将微生物迅速用液氮或者有机溶剂(-40℃)灭活,使其代谢瞬间停止)

生物体液(血浆、血清)

≥200 µL

总体积最低不低于100 µL;血浆为采用抗凝剂抗凝后, 除去血细胞的液体;血清为血液凝固后的上清液

生物体液(尿液)

≥1mL

总体积最低不低于200 µL;尿液需新鲜,未做任何处理

粪便

≥100mg

不能有粪便储存液,直接-80℃冻存

*所有样本均需在采集后,立即置入液氮中速冻,-80℃低温冷冻保存,干冰寄送;建议送样量能满足实验的所有测试需求,最低送样量有一定风险,具体是最终实验结果为准。


Q1:代谢的三种平台GC-MS,LC-MS,NMR有什么区别呢?

A1: LC-MS的覆盖范围很广泛,可用于绝大部分化合物的检测分析,样品前处理步骤简单。GC-MS主要用于易挥发、热稳定、中低极性物质的检测,比如含羟基、羧基、氨基和亚氨基等基团的极性强的物质,样品前处理相对繁琐,但谱图库较为健全;NMR重复性很好,对样本制备要求少,快速,没有偏好性,但灵敏度不及质谱技术。

Q2:代谢物鉴定搜索的数据库有哪些?

A2:我们搜索的库主要包括公共库和自建库,HMDB、KEGG、METLIN等等,精确度都在10ppm以内(一个分子量仍然会对应多个代谢物),如果库里面有相应的二级谱图,那么鉴定就可以更加的精确,后续如果要验证的话,可购买标准品。

Q3:代谢全谱对于样本数量有要求吗?

A3:对于目标在于寻找差异代谢物的代谢全谱来说,临床样本数量每组建议不低于30个,推荐50个以上。模式生物及动植物样本,建议不少于10个。样本量少得到的结果个体差异可能会超越组间差异,使得结果中无法筛选出差异代谢物。


深圳华大科技(总部)

电话:400-706-6615
邮箱:info@genomics.cn