侯一平张思仲
摘要温度调控高效液相色谱法是探索人类基因组DNA序列变异的新手段。温度调控高效液相色谱法通过比较异源双链与同源双链,而非逐个样本直接测序,可以敏感而准确地发现DNA变异,唯发现的变异需进一步测序鉴定。对于旨在发现新突变或新多态性的课题,该方法可以明显减少测序工作量,而对于检出稀少的变异型,可明显降低所需成本。通过自动化操作, 更能显著加快获取数据的速度。本文介绍温度调控高效液相色谱法的原理与命名、技术的主要优点及应用进展。
关键词:温度调控高效液相色谱法;变性高效液相色谱法;温度调控异源双链分析;人类基因组;单核苷酸多态性
人类基因组计划的迅速进展使探索基因组DNA序列变异的任务变得十分迫切。DNA序列变异绝大多数是单核苷酸的改变。大规模的单核苷酸变异检测不论对于含有大量外显子的单个基因,还是引起多因子疾病的多个基因,都是巨大的技术挑战。发展高通量技术以大规模高效地检测单核苷酸多态性(single nucleotide polymorphism, SNP)或突变,是目前基因组计划的前沿课题之一[1]。
离子对反相高效液相色谱法(ion-pair reversed-phase high performance liquid chromatography)作为DNA分析的技术早已存在,但发掘这种技术的潜能并用于探索人类基因组DNA序列变异却是近5年的事[2,3]。基于DNA变性与复性对温度的依赖性, 离子对反相高效液相色谱法能以3种方式操作。(1)在不变性温度条件下,色谱仪类似凝胶电泳仪,可分离分子量不同的双链DNA分子,制备分子克隆所需的DNA片段或分析具有长度多态性的片段,类似RFLP,AmpFLP分析。(2)在充分变性温度条件下,单链DNA或者RNA分子能被区分,适用于寡核苷酸合成纯度质量控制和基于引物延伸的基因型分析。(3)在DNA部分变性的温度条件下进行。此时,变异型和野生型的PCR产物不仅分别形成同源双链,同时也错配形成异源双链。异源双链与同源双链融解温度(melting temperature, Tm)的差异使色谱固定相保留它们的能力有所不同。这样,根据柱上的保留时间可以分辨异源双链与同源双链,从而识别变异型(图1,2)。
图1异源双链形成原理DNA部分变性温度条件下,变异型(GC)和野生型(AT)的PCR产物不仅分别形成同源双链AT和GC,也错配形成异源双链AC和GT
fig 1The principle for formation of heteroduplexesUnder the temperature of part denaturing, there are not only formation of homoduplexes (AT and GC) but also that of heteroduplexes (AC and GT) by mismatch
由图2可以看出,用离子对反相高效液相色谱发现DNA序列变异是基于同时存在异源双链与同源双链。异源双链形成取决于高效液相色谱的温度,而色谱温度的选定与野生型DNA融解温度(Tm)有关。据此,Oefner及Underhill等[2,3]把在接近DNA融解温度条件下进行的离子对反相高效液相色谱分析称为变性高效液相色谱法(denaturing high performance liquid chromatography, DHPLC), 而Kuklin, Taylor及Bonner等[4-7]基于Transgenomic公司的WAVE仪器,把同样的技术称为温度调控异源双链分析
图2色谱温度与野生型DNA融解温度的关系AT:野生型同源双链;GC:变异型同源双链;AC和GT:异源双链
fig 2The relationship between temperature in HPLC and Tm of DNA molecules of wild typeAT:homoduplexes of wild type; GC:homoduplexes; AC and GT:heteroduplexes
(temperature modulated heteroduplex analysis,TMHA)。然而,DHPLC是一个不够明确的术语。首先,分析过程中变性的是DNA分子,而不是高效液相色谱仪,也不是高效液相色谱方法。其次,分析过程中高效液相色谱仪的检测温度并非全部DNA分子的变性温度,因为Tm是指由DNA分子构成的群体中,半数双链DNA分子解链时的温度。接近DNA融解温度的色谱条件意味着半数以上双链DNA分子没有变性。其三,此时检测的是异源双链与同源双链,它们处于复性状态,而不是变性状态。DHPLC这个术语使人难以理解的是,一方面DNA分子在变性,另一方面检测的目标却是双链DNA分子。与DHPLC相比,TMHA定义明确,而后者不足之处在于没有包含高效液相色谱概念。对于以凝胶电泳为主要分析手段的人们,不一定都知道TMHA是由高效液相色谱完成的,因为TMHA同样可以由凝胶电泳完成[8];而从事分析化学的人们也不一定都知道他们所操作的高效液相色谱仪可以进行TMHA。为此,我们建议把在接近DNA融解温度条件下进行的,旨在探索与发现DNA序列变异的离子对反相高效液相色谱技术称为温度调控高效液相色谱法(temperature-modulated high-performance liquid chromatography,TmHPLC)。这样既有TMHA的含意,也有高效液相色谱的传统缩写。更重要的是,TmHPLC隐含有基于野生型DNA的Tm值选择高效液相色谱温度的概念。事实上,Kuklin 等[4,5]也称这是一种基于温度调控的液相色谱新技术(The new technology based on temperature-modulated liquid chromatography)。
许多学者评估了TmHPLC检测人类基因组DNA序列变异的效能。O'Donovan等[9]用盲法分析了TmHPLC的特异性和灵敏度, 对Ⅸ因子基因外显子H 和神经纤维瘤病NFI基因外显子16的分析显示, 55名个体含有的全部48种突变都能正确检出。Choy等[10]比较了构象敏感凝胶电泳(conformation-sensitive gel electrophoresis,CSGE)、单链构象多态分析(single-stranded conformation polymorphism analysis,SSCP) 和TmHPLC检测结节性硬化症基因TSC2突变的能力,在84例用CSGE检测TSC2基因前20个外显子的患者中,TmHPLC不仅检测出了CSGE观察到的全部变异型,而且发现了14个新变异。在18个由SSCP检测观察到的变异型中,TmHPLC不仅检测出了17个变异型,而且发现了7个新变异。对TSC2单核苷酸变异的检出率,SSCP和CSGE分别为69%和54%,而TmHPLC为100%。提示TmHPLC优于SSCP和CSGE,特别是在检出单核苷酸变异方面。Dobson-Stone等[11]比较了Tm HPLC方法和荧光单链构象多态分析(fluorescent single-strand conformation polymorphism,F-SSCP)检测EXT1 和 EXT2基因突变的能力。42个变异型中,TmHPLC检出了40个,F-SSCP检出了39个,检出率分别为95% 和 93%,并认为两种方法有相同的突变检出效能。Skopek等[12]比较了TmHPLC和变性梯度凝胶电泳(denaturing gradient gel electro-phoresis,DGGE)的异源双链分析特性,发现TmHPLC和DGGE测量的都是异源双链分子的融解特性,认为TmHPLC是检出突变和分离纯化变异型DNA的有效手段。Arnold等[13]比较了直接测序与TmHPLC方法分析BRCA1基因突变的能力。对确证为患遗传性乳腺癌和卵巢癌的46名女性患者,用TmHPLC分析了整个BRCA1基因33个DNA片段的1518 份PCR产物, 直接测序了626份。结果证明TmHPLC检出了全部直接测序找到的变异体。在纯合子中, 没有见到假阳性;在有BRCA1突变和多态的女性中也没有见到假阴性。Gross等[14]用TmHPLC分析了直接测序BRCA1基因的113个DNA片段, 发现TmHPLC突变检出率为100%,而SSCP为94%。Liu等[15]的研究结果显示TmHPLC的突变检出率为92.5%,而无突变的196个PCR产物无一例假阳性。这些研究表明,TmHPLC是检测人类基因组DNA序列变异敏感而且准确的手段。
TmHPLC的优点不仅在于把分析单个样本所需时间缩短到了几分钟,更重要的是容易实现自动化操作,从而可从大量样品中快速搜索出未知的变异型,节约人力、物力和时间。Giordano 等[16]采用全自动TmHPLC系统地搜索了人类染色体 5pter-q13区域的124 个序列标签(sequence tagged sites, STSs),在28 个STS中发现了30个SNP,并且与该区域已知遗传标记的重叠小于10%,达到了关联分析观察连锁不平衡所需的遗传标记密度,即平均每一cM一个遗传标记。Wagner等[17,18]用TmHPLC 研究了BRCA1和BRCA2基因,在71个乳腺癌和乳腺卵巢癌家系和95名对照个体的BRCA2编码区10 257 bp和非编码区2799 bp中发现简单序列变异在编码区为每194 bp一个,而非编码区为每108 bp一个,得出了简单序列变异在BRCA2十分常见的结论[18]。Underhill等[19]用自动TmHPLC 对718份样本进行了Y染色体分析,结果发现了22种Y染色体SNP,其中19种以前未见报道[19]。Liu等[20]用自动TmHPLC 分析了94例Marfan 综合症患者fibrillin-1 (FBN1) 基因全部65个外显子,观察到25种多态性和39种突变,其中37种是新发现的突变。这些研究表明,TmHPLC通过自动化操作能明显加快获取数据速度,适用于大群体中基因突变的搜索。
自Oefner和Underhill[2]建立TmHPLC方法以来, 美国Transgenomic公司开发出了能以不变性温度、充分变性温度和TMHA等3种方式操作的离子对反相高效液相色谱自动分析仪,命名为WAVE[4-7]。同期,国内外学者也探索了用普通高效液相色谱仪进行TmHPLC分析的可能性。其中,德国学者Arnold等[13]采用Bio-Tek Kontron公司的高效液相色谱仪, 国内学者廖林川、孟海英及苏智广等[21,22]将惠普公司的高效液相色谱仪用于基因多态性分析也获得了成功。这些工作表明,在有梯
