组织细胞中心

专家团队

长和早期癌症筛查计划

久久源动力评估计划

免疫力保险计划

当前位置: >>新闻动态 >>行业动态 >>

几种常见基因检测技术优缺点及应用


发布时间:2016/10/19

随着人类基因组计划的完成,人类对自身遗传信息的了解和掌握有了前所未有的进步。与此同时,分子水平的基因检测技术平台不断发展和完善,使得基因检测技术得到了迅猛发展,基因检测效率不断提高。从最初第一代以 Sanger 测序为代表的直接检测技术和以连锁分析为代表的间接测序技术,到 2005 年,以 Illumina 公司的 Solexa技术和 ABI 公司的 SOLiD 技术为标志的新一代测 序 (next-generation sequencing,NGS) 的 相继 出现,测序效率明显提升,时间明显缩短,费用明显降低,基因检测手段有了革命性的变化。其技术正向着大规模、工业化的方向发展,极大地提高了基因检测的检出率,并扩展了疾病在基因水平的研究范围。2009 年 3 月,约翰霍普金斯大学的研究人员在《Science》杂志上发表了通过 NGS外显子测序技术,发现了一个新的遗传性胰腺癌的致病基因 PALB2,标志着 NGS 测序技术成功应用于致病基因的鉴定研究。同年,《Nature》发表了采用 NGS 技术发现罕见弗里曼谢尔登综合征MYH3 致病基因突变和《Nat Genet》发表了遗传疾病米勒综合征致病基因。此后,通过 NGS 技术,与遗传相关的致病基因不断被发现,NGS 技术已成为里程碑式的进步。2010 年,《Science》杂志将这一技术评选为当年“十大科学进展”。

  近两年,基因检测成为临床诊断和科学研究的热点,得到了突飞猛进和日新月异的发展,越来越多的临床和科研成果不断涌现出来。同时,基因检测已经从单一的遗传疾病专业范畴扩展到复杂疾病和个体化应用更加广阔的领域,其临床检测范围包括高危疾病的新生儿筛查、遗传疾病的诊断和基因携带的检测以及基因药物检测用于指导个体化用药剂量、选择和药物反应等诸多方面的研究。目前,基因检测在临床诊断和医学研究的应用正越来越受到医生的普遍重视和引起研究人员的极大的兴趣。

 

 

  1、第一代测序

  1.1 Sanger 测序 采用的是直接测序法。1977年,Frederick Sanger 等发明了双脱氧链末端终止法,这一技术随后成为最为常用的基因测序技术。2001 年,Allan Maxam 和Walter Gibert 发 明了 Sanger 测序法,并在此后的 10 年里成为基因检测的金标准。其基本原理即双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP) 缺乏PCR 延伸所需的 3'-OH,因此每当DNA 链加入分子 ddNTP,延伸便终止。每一次 DNA 测序是由 4个独立的反应组成,将模板、引物和 4 种含有不同的放射性同位素标记的核苷酸的 ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的 DNA 片段存在于反应体系中,具有单个碱基差别的 DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取 DNA 双链的碱基序列。

  人类基因组的测序正是基于该技术完成的。Sanger 测序这种直接测序方法具有高度的准确性和简单、快捷等特点。目前,依然对于一些临床上小样本遗传疾病基因的鉴定具有很高的实用价值。例如,临床上采用 Sanger 直接测序 FGFR 2 基因证实单基因 Apert 综合征和直接测序 TCOF1 基因可以检出多达 90% 的与 Treacher Collins 综合征相关的突变。值得注意的是,Sanger 测序是针对已知致病基因的突变位点设计引物,进行 PCR 直接扩增测序。单个突变点的扩增包括该位点在内的外显子片段即可,不必将该点所在基因的全部外显子都扩增。

  因此,应明确定位要扩增的位点所在的基因外显子和该点的具体位置,设计包括该点在内的上下游 150 ~ 200 bp 的外显子片段引物。此外,尽管有NGS 的出现,但 Sanger 测序对于有致病基因位点明确并且数量有限的单基因遗传疾病的致病基因的检测是非常经济和高效的。到目前为止,Sanger 测序仍然是作为基因检测的金标准,也是 NGS 基因检测后进行家系内和正常对照组验证的主要手段。

  值得注意的是,Sanger 测序目的是寻找与疾病有关的特定的基因突变。对于没有明确候选基因或候选基因数量较多的大样本病例筛查是难以完成的,此类测序研究还要依靠具有高通量测序能力的 NGS。虽然 Sanger 测序具有高度的分析准确性,但其准确性还取决于测序仪器以及测序条件的设定。另外,Sanger 测序不能检测出大片段缺失或拷贝数变异等基因突变的类型,因此对于一些与此相关的遗传性疾病还不能做出基因学诊断。

 

 

  1.2 连锁分析 采用的是间接测序法。在 NGS 出现之前,国际通用的疾病基因定位克隆策略是建立在大规模全基因扫描和连锁分析基础上的位置候选基因克隆。人类的染色体成对出现,一条来自父亲,一条来自母亲,每一对染色体在同样的位置上拥有相同的基因,但是其序列并不完全相同,被称为父系和母系等位基因。遗传标记是指在人群中表现出多态现象的 DNA 序列,可追踪染色体、染色体某一节段或某个基因座在家系中传递的任何一种遗传特性。它存在于每一个人,但大小和序列有差别,具有可遗传性和可识别性。目前采用第二代遗传标记,即重复序列多态性,特别是短串联重复序列,又称微卫星标记。连锁分析是以连锁这种遗传现象为基础,研究致病基因与遗传性标记之间关系的方法。如果控制某一表型性状的基因附近存在遗传标记,那么利用某个遗传标记与某个拟定位的基因之间是否存在连锁关系,以及连锁的紧密程度就能将该基因定位到染色体某一位置上。1986 年 Morton 等提出优势对数记分法 (log odds score method,LOD),主要检测两基因以某一重组率连锁时的似然性。LOD 值为正,支持连锁 ;LOD 值为负,则否定连锁。通过计算家系中的微卫星标记与致病位点之间的 LOD 值,可以初步估算二者间的遗传距离及连锁程度,从而确定该基因在染色体上的粗略位置。然后利用该区域的染色体基因图谱,分析定位区域内基因的功能与表达,选择合适的候选基因进行突变检测,最终将致病基因定位或克隆。

  然而,采用连锁分析进行基因检测存在很大的局限性。不但所需遗传样本量较大,一般要求提供三代及以上遗传家系患者血样,而且数据量大、处理复杂、产出速度较慢、定位不够精确 ( 一般只能定位在染色体某一区间 ),这就使得研究工作繁重和定位基因的时间周期特别长。目前,连锁分析采用的单核苷酸多肽性和短串联重复序列还在使用,但经典的间接测序方法,如单链构象多肽性、变性梯度凝胶电泳和异源双链分析在美国已被淘汰,而在发展中国家作为研究手段还在有限使用。

 

 

  2、新一代测序 (NGS)

  主要 包 括 全 基 因 组 重 测 序 (whole-genomesequencing,WGS)、全外显子组测序 (whole-exomesequencing,WES) 和目标区域测序 (Targeted regionssequencing,TRS),它们同属于新一代测序技术。总体而言,NGS 技术具有通量大、时间短、精确度高和信息量丰富等优点,使得遗传学者可以在短时间内对感兴趣的基因进行精确定位。但这些不同的测序技术在测序范围、数据分析量以及测序费用和时间等方面又有很大差别,如果选择适合的方法,对于临床诊断和科学研究将起到事半功倍的作用。

  2.1 目标区域测序 目前常用的是基因芯片技术。其测序原理是基于 DNA 杂交原理,利用目标基因组区域定制的探针与基因组 DNA 进行芯片杂交或溶液杂交,将目标基因区域 DNA 富集,再通过NGS 技术进行测序。其测序过程是通过把数以万计的 cDNA 或寡聚核苷酸置于芯片上制成列阵,将芯片上固定好的已知序列的核苷酸探针与溶液中含有荧光标记的相应核酸序列进行互补配对,根据测序仪所显示强荧光的位置和强度,获取每组点阵列信息,再利用生物信息学算法确定目的靶核苷酸的序列组成。测序所选定的目标区域可以是连续的 DNA 序列,也可以是分布在同一个染色体不同区域或不同染色体上的片段。目标区域测序技术,对于以往通过连锁分析将基因突变锁定在染色体某一片段区域内,但无法找出突变是一个非常好的进一步检测手段。2010 年,Nicholas等使用基因分型芯片联合连锁分析技术,成功发现头小畸形的新基因 WDR62,文章发表在《NatGenet》杂志。类似的研究在家族性胰腺癌中确定 8 个候选变异位点和在家族性渗出性玻璃体视网膜病变发现易感基因 TSPAN12。

  基因芯片测序技术可以将经过连锁分析锁定了目标范围或经过全基因组筛选的特定基因或区域进行更深一层的研究,是解决连锁分析无法发现致病基因的有效手段。基因芯片技术对于已知基因突变的筛查具有明显优势,可以快速、全面地检测出目标基因突变。同时,由于目标区域受到了限制,测序范围大幅度减少,测序时间和费用相应降低。但基因芯片检测所需要的 DNA 的量要大,由于已提取的 DNA 存在降解的风险,用于基因芯片研究的血标本最好是冰冻的全血,这样可以使用于检测 DNA 的量有充分保证。

 

 

  2.2 全外显子组测序 (WES) 外显子组是单个个体的基因组 DNA 上蛋白质编码序列的总合。人类外显子组序列约占人类全部基因组序列的 1%,但大约包含 85% 的致病突变。WES 是利用序列捕获技术将全外显子区域 DNA 捕捉并富集后进行高通量测序的基因分析方法。采用的技术平台主要是罗氏公司的SeqCap EZ 全外显子捕获系统,Illumina 公司的Solexa 技术和 Agilent 公司的 SureSelect外显子靶向序列富集系统。其捕获的目标区在 34 ~ 62 M 之间,不仅包括编码区同时也加入了部分非编码区。NGS 的测序过程主要包括DNA 测序文库的制备、锚定桥接、PCR 扩增、单碱基延伸测序和数据分析。研究者根据测序仪捕获到在测序过程中掺入有不同荧光标记碱基片段,经计算机将荧光信号转化成不同颜色的测序峰图和碱基序列。基因测序结果与NCBI的SNP数据库、千人基因组数据库等国际数据库比对,最终确定是否为突变基因。

  自NGS 技术问世以来,利用 WES 在临床疾病致病基因的鉴定研究中取得前所未有的成果。这些成果不仅集中在单基因遗传疾病,还在多基因影响的复杂疾病中获得大量相关基因的发现。在单基因遗传性疾病中,如视网膜色素变性、终端骨发育不良等发现新基因或已知基因新突变。在一些罕见的疾病中,如 Kabuki 综合征、家族性混合型低脂血症和脊髓小脑共济失调症等疾病中发现新的致病基因。同时,在小细胞肺癌、慢性淋巴细胞性白血病等肿瘤研究和诸如肥胖症、脑皮质发育不良等复杂疾病的研究中也取得丰硕成果。

     WES技术在筛查范围和检出率等方面较其他测序技术具有明显的优势。例如,对于采用Sanger测序和基因芯片测序不能筛查出基因的样本,可以采用WES来进一步基因筛查鉴定。应用WES 技术能够获得较传统Sanger等方法对编码区测序更深的覆盖度和更准确的数据。由于信息量的大幅度增加,WES可以获得更多个体的编码区信息,因此成为检测致病基因和易感基因位点的有效手段。与连锁分析定位方法比较,WES对家系中2-3个患者和一个正常人即可进行致病基因的鉴定研究,而不需要连续三代的遗传家系。由于不需要严格的三代以上的遗传家系,WES使以前不能进行研究的家系成为可能。不仅对于单基因遗传病是一个很好的研究手段,对于许多常见病,如肿瘤、糖尿病等疾病也可进行大规模的比较研究。

 

 

2.3全基因组重测序(WGS)

WGS是对已知基因组序列的物种进行不同个体的全基因组的测序,经过数据分析后对序列进行拼接、组装并获得基因组图谱,或是对不同组织进行测序并分析体细胞突变的一种研究方法。尽管WES可以快速全面地找出个体基因祖上的突变,从而找到个体间的差异,但对于外显子以外的区域则不能有效地进行基因检测。对于此种情况,目前还要借助WGS进行全基因组检测。但由于人类基因组过于庞大,一次单端全基因组测序很难达到所需要的测序深度。因此,需要重复测序或双端测序,由此带来测序成本的大幅度提高和由于不能达到足够的测序深度所导致的结果准确性的降低。而对于部分临床研究和WES不能解决的科研课题还需要借助WGS进行更加全面的基因检测。

 

 

3、如何选择适合检测方式

随着我国经济的飞速发展,人们生活水平的提高的同时,也增加了恶性肿瘤的发病率和死亡率。2015年中国新增恶性肿瘤429.2万新发病例,死亡281.4万病例。其中大约5-10%的癌症具有遗传性。这种遗传性是由患者自身携带的基因决定的。基因检测做为预防医学中的重要一环提早发现,提早干预,降低死亡率被大多数专家所认可。 那如何选择适合自己的检测方法呢?长和久久癌筛利用SNP检测金标准SNaPshot基因测序平台提供极具性价比的遗传性肿瘤基因突变筛查方案。检测panel的设计涵盖绝大部分已知的遗传性肿瘤易感基因,可以从基因水平一次性筛查多种类型的家族性肿瘤综合征,为医生提供更加高效准确的诊断依据。涉及11种我国人群最高发的恶性肿瘤,其中包括肺癌、肠癌、食道癌、胃癌、乳腺癌、卵巢癌、前列腺癌、胰腺癌、肝癌、肾癌、膀胱癌等。可以检测99个相关位点。基于遗传学原理,家族性肿瘤患者的亲属也会受益于基因检测进行有效的疾病风险管理。

 

 

       目前,发展大规模的个体化基因检测势在必行。同时,药物性易感基因和疾病发生的易感基因的检测的深入开展,个体化医疗将在基因检测的基础上得以实现。有理由相信,随着人们生活水平的不断提高和健康意识不断增强,基因检测在未来医学发展中应用前景将十分可观。