杨光邵宁生柳川
摘要综述了有关研究报道中随机RNA文库的特点,重点讨论了随机RNA文库构建中的理论问题和应遵循的原则。
关键词:随机RNA文库;靶分子;配基
随机RNA文库是由大量的随机的RNA分子构成的生物文库。自从1990年Ellington等和Gold等[1,2]分别利用随机RNA文库筛选出染料分子及T4 dNA聚合酶的特异寡核苷酸配基以来,随机RNA文库的应用日益广泛。早期主要是用随机RNA文库筛选靶分子的高亲和力和特异性的配基,至今已经筛选出配基的单一靶分子有几十种,可以分为以下几大类:(1)核酸结合蛋白,如核糖体蛋白S1、HIV1 rev蛋白等;(2)非核酸结合蛋白,如凝血酶、各种生长因子、抗体、人非胰腺分泌的磷脂酶A2[3]等;(3)小的多肽,如缓激肽、P物质等;(4)小分子有机物,如组织染料、ATP、茶碱等[4]。目前随机RNA文库主要被用于一些蛋白质的结构与功能及生物大分子之间的相互作用研究。研究的方向主要有:(1)蛋白质与编码该蛋白的mRNA结合序列的确定,如蛋白Unr[5]等;(2)研究RNA结合蛋白与RNA结合的核心区域,如具有锌指结构的转录因子IIIA[6]、细菌转录启动子组成之一的UP[7]等;(3)寻找某些RNA伴侣分子的RNA识别结构,如胱冬肽酶A(caspase a)家族[8]、辅酶A[9]等;(4)筛选一些对酶活性有影响的RNA序列,如枯草杆菌蛋白酶活性的抑制序列[10]及2′,5′-寡腺苷酸合成酶活性的激动序列[11]等。随机RNA文库之所以得到广泛的应用,是由于利用随机RNA文库筛选靶分子特异性配基有较多优点,如能筛选的靶分子范围广、配基与靶分子结合的亲和力高和特异性强等。目前,随机RNA文库已在基础研究、临床诊断以及药物筛选中得到了广泛应用。
在利用随机RNA文库筛选靶分子特异配基之初,文库的构建至关重要。构建一个合理并且可行的文库是快速、特异地筛选出靶分子配基的前提和基础。本文就随机RNA文库的构建综述如下。
1随机RNA文库用于筛选靶分子特异配基的理论基础
体内绝大多数的RNA都是以单链的形式存在。经实验证实,在单链的RNA中可以通过局部的序列互补形成A型螺旋。碱基配对除有AU和GC标准碱基对以外,还存在GU形成的变偶碱基对,故而在RNA文库的随机序列中必然会存在互补序列,这也导致了各种结构模式的产生,如发夹、颈环、假结(pseudoknot)、鼓包(bulge)等。这些结构与要筛选的靶分子的空间位点通过氢键、范德华力及空间结构的相互嵌合作用等形成稳定的复合物,也就是说,二者的空间结构互补导致的结合是具有分子或生物特异性的。组合化学技术——指数式富集配体进化(systematic evolution of ligands by exponential enrichment,SELEX)正是利用随机RNA文库中这些结构模式易与靶分子结合的特点来筛选相应配基的[2]。在筛选靶分子特异性配基的过程中,随机序列形成的不同空间结构与靶分子特定的表位亲和力不同,通过竞争性选择得到靶分子的高亲和力特异配基。理论上,用随机RNA文库对靶分子进行筛选,经过一定的循环次数后,必然会产生一种亲和力和特异性都最大的配基与该靶分子某一特定位点结合。
2RNA文库的基本模式
目前,用来筛选靶分子的特异配基的随机RNA文库长度从几十到几百个碱基不等。文库两端为一定长度的固定序列,中间为一定长度的随机序列。基本结构模式为:
5′-NNNNNNNNNNNrrrrrrrrrrrrrrrrrNNNNN-
nNNNNNNN-3′,其中N代表固定序列,r代表随机序列。
例如:Tuerk和Gold等[2]于1990年筛选T4 DNA聚合酶所采用的随机RNA文库的序列为:CAAGAGCCUrrrrrrrrrGGGCUAUAAACUAAGGA-
aU[13]。
根据靶分子的自身特点,有少数随机RNA文库有两段甚至是多段随机序列[12,13]。
3模板链和引物的设计
由于RNA自身的不稳定性,文库的合成通常不是直接合成RNA序列,而是先合成模板链,再由模板链经体外转录成随机RNA文库。所谓模板链就是双链DNA文库。模板序列是由随机RNA文库的序列经过碱基互补而推出的,故而序列的结构模式和随机RNA文库的结构模式相似:两端为一定长度的固定序列,中间为随机序列。固定序列一方面为文库的扩增做准备,另一方面也是为了增加文库的稳定性。由于设计的引物是与固定序列互补,因此,在设计文库的固定序列时要尽量避免形成引物二聚体或使引物自身折叠,否则会使在PCR反应中降低反应的特异性,也有可能造成扩增的序列与原文库有差异。在固定序列的设计上往往加入较多的G/C碱基,以提高今后PCR反应的退火温度和反应的特异性。在设计引物时,一般在反向引物序列加上T7启动子,以利于每轮筛选富集的DNA序列的体外转录。另外,为了以后的克隆及测序的需要,通常在引物序列中还要加入特定的限制性酶切位点。
例如,在利用RNA文库筛选VEGF的配基时[14],随机RNA文库序列为:5′-GGGAGCUCAGAAUAAACGCUCAA(30N)UUCGACAUGAGGCCCGGAUCCGGC-3′,而模板ssDNA序列为:5′-GCCGGATCCGGGCCTCATGTCGAA(N30)TTGAGC-
gTTTATTCTGAGCTCCC-3′。正向引物序列为:5′-GCCGGATCCGGGCCTCATGTCGAA-3′(下划线的部分为BamHⅠ的限制性酶切位点)。反向引物序列为:5′-CCGAAGCTTAATACGACTCACTATAG-
gGAGCTCAGAATAAACGCTCAA-3′(下划线的部分为HindⅢ的限制性酶切位点,黑体部分为T7启动子)。
4随机RNA文库的库容量和随机序列的丰度
随机RNA的库容量为文库中含有不同核苷酸排列的序列数。库容量的计算方法为:库容量=4n(其中n为文库中随机序列的长度),如n为30个碱基时,库容量为430,亦即1018。随机RNA文库中的随机序列的丰度F是指在整个文库中含有某一特定序列的序列数,其数值的大小为文库中总的序列数和文库容量的比值。在随机RNA文库中,选择一条单一的核酸链的概率符合Poisson分布,表达式为:P(r,m)=mre-m/r!,其中P为r次筛选出同一序列的概率,r为某单一核酸序列被选择的次数,m为Poisson分布的整体平均数。对于含有T个分子的随机RNA文库而言,m=T/4n。在随机RNA文库中,某一单一序列没有被选择即r=0,p(0,m)=e-m=e-T/4n。所以,某一单一序列被选择的可能性为P=1-p(0,m)=1-e-T/4n。在一个随机RNA文库中总的分子数T,库的大小和某一单一序列被选择的可能性之间在上面的关系式中得到了反映。如果筛选出单一序列的概率分别为50%、98%、99.8%时,T对n的关系可用图1表示。分析该图可以得出以下结论:(1)随机RNA文库随机序列的长度和文库的序列长度都不能过长,如果过长,由于合成的文库浓度是一定的,故而使筛选出来的特定配基序列的概率降低。(2)随机RNA文库中随机序列增加或减少一个核苷酸,在一定浓度的情况下,可能会明显地影响某一单一序列筛选出来的概率,差异从50%到90%。同样,为了保证某一单一序列筛选出来的概率,每增加1.66个核苷酸,需要使整个库中的RNA的浓度增加10倍。可见,随机的序列不宜过长,否则会对整个反应体系的RNA量要求太高;但是也不能太少,太少则导致整个库的容量变小,同时也不能形成与靶分子结合所需的特定结构。若要使文库中筛选出任何一条特定序列概率为99.8%,目前所采用的RNA文库随机序列的长度多在25~35之间,这个长度的序列足以形成发夹、鼓包、假结等结构。
图1随机RNA文库序列长度与总RNA分子数的关系
5RNA文库的稳定性
由于RNA酶的广泛存在,并且其作用并不需要特异性核酸序列,故而RNA文库的稳定存在是实验的前提。由RNA文库的基本模式可知,文库的稳定性主要取决于序列两端的固定序列。目前文献中采用的RNA文库两端固定序列构建的主要思路为:设计的5′端固定序列和3′端固定序列有一段互补区。如筛选与RNA酶P结合的RNA配基所用文库两端的固定序列为:5′端为ACGGAUUCGCUCAA,3′端为 UUCAGAAUUCGCACCA(划线的部分为互补序列),这种序列能使RNA文库在空间上形成一段双链区,从而使其稳定性增加。利用某一些RNA能够在体内稳定存在的特点,一些随机RNA文库在固定序列设计上采用了这些稳定存在的RNA的部分互补序列,如上述筛选RNA酶P所用的RNA文库的固定序列就是来自pre-tRNAphe的三叶草的叶柄部分。目前,为增加随机RNA文库的稳定性,一些实验中对固定序列中的某些碱基进行化学修饰,如用氨基或氟取代嘧啶碱基中2位的羟基。在对IgE的特异配基筛选过程中,采用了化学修饰的RNA文库,来增加文库的稳定性。
6某些具有特定目的文库的构建
目前,一些随机RNA文库的构建具有明确而特定的目的性。这些文库的长度、固定序列和随机序列的设计等都与靶分子或其<
