单细胞RNA测序技术概述
目前高通量测序技术已经深入到人类疾病、物种进化、动植物分子育种等传统的生物学研究领域中,逐渐成为一种不可或缺的研究工具。然而随着生命科学和医学基础研究的深入发展,人们发现越来越多的特殊标本和特定的生物学现象,如法医鉴定的微量标本、肿瘤内部异质性等无法用常规组织测序的方法进行研究。单细胞测序技术的出现,给这类样本的研究带来了极大的便利。
单细胞测序技术经过了10余年的发展,取得了众多的技术进展与突破。其中,单细胞RNA测序技术中,Smart-seq方法以其可实现完整mRNA扩增的优势,被广泛的应用。而近期广受关注的另外一个高通量单细胞RNA测序技术由Macosko E团队开发,其研究成果于2015年发表在《Cell》杂志上,该技术结合了微流控液滴法,磁珠对细胞进行标记,可一次性完成多至一百万个细胞分离和扩增建库,这个技术的出现大幅的降低了单细胞RNA测序的成本,使得单细胞RNA水平的研究得到了飞跃发展。
华大基因依托于这两个技术开发优化的相应单细胞RNA测序产品:单管单细胞RNA测序、高通量单细胞RNA-seq 。其中,单管单细胞RNA测序,采用的是基于Smart-seq2的扩增方法,获得全长转录本,随后Tn5转座酶进行建库测序,该扩增方法不仅可以用于转录本的定量,还可以分析结构变异和功能方面的信息。
研究流程
图1 单细胞RNA测序技术流程图
Smart-seq扩增原理
单细胞RNA水平的研究的主要难点是单个细胞RNA含量只有pg级别,不易直接提取RNA后构建高通量文库。华大基因的单管单细胞RNA测序产品利用Smart-seq2方法,通过oligo dT 直接对mRNA进行反转录,在逆转录的过程中,利用一个叫MMLVRT(Moloney Murine Leukemia Virus Reverse Transcriptase,MMLVRT)的逆转录酶,这个酶的特性是逆转录至mRNA的5’末端后,会发挥末端转移酶的活性,在cDNA的3’端额外合成一段不依赖模板的几个碱基序列,并以逆转录体系中游离的特定碱基序列作为新的模板继续合成cDNA,最终得到了一个两端包含固定序列的全长的单链cDNA模板,随后利用此cDNA作为模板进行大量扩增。
文库构建流程
扩增得到的双链cDNA经过Tn5转座酶切打断及加接头, PCR扩增及磁珠纯化等步骤,即得到所需测序文库。构建好的文库经Agilent片段分析仪和Q-PCR质控合格后可进入测序环节。
测序策略
表1 测序策略及数据推荐
| 测序读长推荐 | PE100 |
| 测序平台 | DNBSEQ平台 |
| 测序数据量推荐 | 6G或以上 |
信息分析内容
单细胞转录组测序能反映基因的表达差异,有助于研究基因调控网络和基因表达的异质性与随机性,结合系统生物学的方法,能应用到肿瘤研究领域。单细胞水平的基因表达调控网络分析,可监控疾病进程,持续追踪肿瘤相关基因的动态表达,对单个细胞的转录组进行测序,还可以研究胚胎不同发育阶段的组织器官图谱。以下是我们的生物信息分析内容:
表2 标准信息分析内容
| 信息分析条款 | 信息分析内容 |
| 标准信息分析 | 1、基本数据统计 ① 去除接头序列、低质量序列得到reads信息, ② 样品相关性, ③ 表达量分布, ④ RNA分类; 2、参考基因组比对; 3、mRNA鉴定; 4、mRNA定量分析; 5、mRNA差异表达分析(样本间、组间); 6、mRNA表达/差异基因聚类; 7、mRNA差异基因GO分类、富集; 8、mRNA差异基因KEGG分类、富集; 9、mRNA结构分析 ① 可变剪切分析, ②融合基因分析(仅限人) |
| Dr.Tom信息分析(ref) | 一、数据库注释 1、转录因子注释(AnimalTFDB/PlantTFDB); 2、GSEA分析; 3、Rfam、Pfam、Reactome、COG、EggNOG和InterPro数据库注释; 二、互作网络分析 1、靶基因分析 ① miRNA-mRNA靶向关系分析, ② lncRNA-mRNA靶向关系分析; 2、ceRNA互作网络分析; 3、蛋白互作网络分析; 4、共表达互作网络分析; 三、特色分析 1、自定义标签和自有数据上传; 2、外部数据库信息(TCGA、ARCHS4); 3、卡方检验; 4、关键驱动基因网络图分析; 5、时间序列分析 |
| 定制化信息分析 | 可结合客户的需求,协商确定定制化信息分析内容。 |