- 首页 > MHC 捕获测序
MHC 捕获测序
MHC区域序列捕获技术是利用目标区域MHC区域序列设计探针,并通过捕获的方法将其富集,利用高通量测序手段对该区域DNA序列的变异进行分析。本产品研究的区域是hg19:chr6:28477797-33448354,共计4.97 Mb;包含了传统MHC区域(约3.37 Mb)及其侧翼区域(约1.6 Mb),成功实现了对于常规扩增方法难以得到的高重复区域的高覆盖和有效富集。
产品优势
1. BGI和NimbleGen联合研发探针,测试结果与基因分型SNP一致率高达99.42%,覆盖度达到97%;
表1 三个样品(YH、NA18532、NA18555)测序数据
表2 MHC捕获测序与芯片分型比较
2. 成功实现了对此区域的高覆盖(覆盖率:>97%,涵盖传统3.37 Mb MHC核心区域,并扩展了周围1.6 Mb区域);
3. 可对该区域中26个基因(A,B,C,DRB1,DQB1,DPA1,DPB1,DQA1,G,DMA,DMB,DOA,DOB,DRA,E,F,H,J,K,MICA,MICB,P,TAP1,TAP2, V,L)进行HLA分型,分型至少可以达到四位数水平(依赖于现有数据库里的型别),分型准确率可以达到95%以上。
4. 已发表文章科研及方法学文章4篇,科研经验丰富。
研究策略
PE126(500bp插入片段)或PE151(300bp插入片段), 推荐PE126,1G raw data
标准信息分析内容
1. 去除接头污染和低质量数据
2. 数据通过BWA与数据库进行比对
3. 数据产量统计分析、测序深度分析、覆盖度均一性分析
4. SNP变异信息检测(SAMtools、SOAPsnp、GATK)
5. SNP的RefGene注释
6. SNP数据库分析(与dbSNP、千人基因组数据、ESP外显子组数据库以及炎黄基因组(仅亚太地区)数据进行数据库注释分析)
7. 单样品SNP保守性预测、致病性分析
8. SNP在各基因功能元件上的分布统计
9. InDel变异信息检测(SAMtools、GATK)
10. InDel的RefGene注释
11. InDel数据库分析(与dbSNP 、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)
12. InDel在各基因功能元件上的分布统计
13. 26个基因的HLA分型
HLA分型方法说明
(1) 筛选reads:从BAM文件中挑选单端或双端map上的reads,以及没有map上的高质量reads,按照基因进行归类保留。
(2) 重比对和变异检测:将上述保留的reads用BWA软件重新比对到IMGT/HLA数据库中,该数据库包含所有目前已知的HLA型别。比对时,最多允许两处不一致(SNP/InDel导致的),这种reads最终保留,并且用最接近的参考序列替代。基于新比对的数据进行变异检测以及质控。
(3) Haplotype组装和打分:利用reads之间的重叠序列将reads拼接成haplotype,重叠序列长度要求至少10bp。将组装的haplotype参照IMGT/HLA数据库进行过滤,保留只存在于数据库中的haplotype。根据haplotype的reads数目、覆盖度、均一度对保留的haplotype进行打分。
(4) 确定最优的HLA型别:结合基因所有的外显子,将haplotype进行连锁,通过之前对haplotype的打分和reads覆盖情况,从中挑出最优的型别1和型别2。
图2 HLA分型思路
华大案例:大样本量测序揭示汉族人群MHC区域特征及其与疾病的关系
Deep sequencing of the MHC region in the Chinese population contributes to studies of complex disease(Nature Genetics. 2016)
文献摘要:
1) 对10,689个健康人和9,946个银屑病人进行MHC捕获测序,构建了汉族人特有的MHC数据库,极大提高了HLA基因分型的准确性。
2) 发现多个新的独立的银屑病易感基因位点:HLA-C, HLA-B, HLA-DPB1, BTNL2,基因间区变异 rs1188179173,也发现银屑病中常见的易感基因HLA-C*06:02。
3) 汉族人特有的MHC数据库有助于疾病致病机理的研究。
图1 汉族人群和欧洲人群的HLA等位基因频率存在显著差异
图2 汉族人群中29个MHC基因的多样性
8个多样性最高的位点分别为:HLA-B (D = 0.959) ,HLA-DRB1 (D = 0.928), HLA-C (D = 0.915) ,HLA-A (D = 0.897) ,MICA (D = 0.892) ,HLA-DQB1(D = 0.890) ,HLA-DQA1 (D = 0.867), HLA-DPB1 (D = 0.802) 。D代表多样性。
附:华大已发表MHC文章列表
文献标题 |
发表期刊 |
影响因子 |
发表日期 |
An Integrated Tool to Study MHC Region: Accurate SNV Detection
and HLA Genes Typing in Human MHC Region Using Targeted High-Throughput
Sequencing |
PLoS One |
3.06 |
2013/07 |
Deep sequencing of the MHC region in the Chinese population
contributes to studies of complex disease |
Nature Genetics |
27.96 |
2016/05 |
HLA-DRB1*15:01 and HLA-DRB3*02:02 in PLA2R-Related Membranous
Nephropathy |
Journal of the American Society of Nephrology |
8.97 |
2016/12 |
Typing and copy number determination for HLA-DRB3, -DRB4 and
-DRB5 from next-generation sequencing data |
HLA |
1.60 |
2017/02 |
表1 送样建议和级别判断
样品类型 |
总量 |
浓度 |
完整性(胶图) |
纯度 |
|
基因组 DNA |
常规 |
≥1ug |
≥12.5ng/uL |
主峰>20Kb |
无蛋白,RNA/盐离子等污染,样本无色透明不粘稠 |
微量 |
≥200ng |
≥2.5ng/uL |
无降解或轻微降解 |
如果建库采用Agilent SureSelect QXT试剂盒,则要求DNA总量≥50ng,浓度≥25ng/μL |
|
FFPE DNA |
常规 |
≥1ug |
≥12.5ng/uL |
主峰>500bp |
无蛋白,RNA/盐离子等污染,样本无色透明不粘稠 |
微量 |
≥200ng |
≥2.5ng/uL |
主峰>500bp |
- |
Q1:MHC捕获试剂盒的捕获区域有多大?
捕获区域共4.97 Mb,包含了传统的MHC区域(约3.37 Mb)及其侧翼区域(约1.6 Mb),以及8个单体型信息。
Q2:MHC捕获测序用的是哪个捕获平台?
由于MHC捕获试剂盒是由BGI和NimbleGen联合开发,故捕获平台采用的是NimbleGen液相捕获平台。
Q3:MHC捕获测序目前只能做人的样品吗?
人MHC捕获测序目前已成为标准化产品。至于其他物种,需要重新设计捕获探针后再做定制化目标区域捕获。
Q4:BGI的分型准确率可以达到什么水平?
分型至少可以达到四位数水平,主要依赖于现有数据库里的型别。分型准确率可以达到95%以上。
Q5:FFPE等其他特殊样本可以做MHC捕获测序吗?
可以。但是样品量必须达到华大样品检测标准,并且杂交数推荐2杂。
Q6:MHC推荐数据量为多少?
1Gb raw data。