[中图分类号]R371.3[文献标识码]A
[文章编号]1000-8861(2000)05-0387-04
Applicationofthephagedisplayrandompeptidelibrary
生物大分子间的相互作用是一切生命现象的基础。机体内众多的生物学效应,包括免疫应答、信号传导、基因调控、细胞凋亡等,都是通过生物大分子之间或亚基之间的相互作用而实现的,因而生物大分子结构与功能的研究一直是分子生物学研究的中心。分子特定的功能依赖于它所具有的特定结构。为深入全面地了解蛋白分子的功能,必须了解蛋白质的结构,特别是蛋白分子某种功能所对应的特定空间结构,这对于研究和分析生物大分子相互作用的机理以及分子结构与功能之间的关系,进而在分子水平上认识生物体系至关重要。研究分子间相互作用的方法有许多,其中,噬菌体随机肽库是近年来新兴的一个探索受体与配体之间相互作用结合位点、寻求高亲和力生物活性的配体分子、探测未知蛋白空间结构表位的有利工具,在蛋白分子相互识别的研究、新型疫苗的研制、以及药物的开发等领域具有广泛应用前景。
1噬菌体随机肽库
噬菌体随机肽库是由上亿种与噬菌体外壳蛋白以融合的形式呈现在噬菌体表面的多肽所组成,库中上亿种多肽分别呈现在上亿个噬菌体表面,众多重组型噬菌体便组成了噬菌体随机肽库。随机肽库所用的噬菌体为丝状噬菌体fl、fd和M13。与其它噬菌体不同,丝状噬菌体并不裂解宿主菌,而是以分泌形式扩增,每个感染细胞内每代可产生上百个病毒颗粒,因此,获得的噬菌体滴度很高,约1010~1012pfu/ml,足以满足库容的需要。扩增时,病毒基因从细胞膜上溢出时被外壳蛋白包被。噬菌体的外壳蛋白pVⅢ约2 700~3 000个拷贝,包绕病毒基因组螺旋对称排列,构成圆管型的噬菌体外壳。PⅢ外壳蛋白在噬菌体的最尾端,约3~5个拷贝,能与细菌F纤毛结合,是噬菌体感染大肠杆菌所必需。噬菌体随机肽库中,表达的多肽连接在外壳蛋白gpⅢ或gpⅧ的N端,呈现在噬菌体表面。由于特异的融合型多肽是通过对固相化靶分子的亲和力来筛选,因而可以在预先不知道多肽结构的情况下,对上亿种噬菌体组成的肽库进行高效筛选和富集。筛选出的噬菌体克隆通过再次感染细菌得到扩增,该克隆所呈现的多肽间接通过克隆噬菌体DNA测序获得。靶分子的每个结合部位均存在各自特定的结合模型(motif,基序)。从筛选出的噬菌体克隆这些多肽序列中可以反映出这种结合模型。将此基序与靶分子的天然配体结构进行比较,可以知道这些多肽模拟的是配体的哪一个空间结合部位。实际上,噬菌体肽库的融合型多肽与靶分子的结合是直接从三维结构上模拟了天然配体分子与靶分子结合的结合部位,从而给我们提供了分析生物大分子相互作用的有效信息。
2蛋白分子结构分析
蛋白分子的结构与功能紧密相连。研究蛋白分子间的结合以往通常需要蛋白分子的空间结构为基础。然而蛋白分子的空间结构并不如一级结构那样容易获得,纯化蛋白分子单晶体获得的极大困难使得靠晶体衍射分析获取精确的分子空间结构数据受阻。并且,蛋白分子的构象是可变的,在生物体内液相环境中的构象并不一定与固相结构完全相同;用软件预测蛋白分子的空间结构也仅有50%~60%的准确性。通过对蛋白分子识别的衍射分析,发现两个分子相互作用所需的绝大部分结合能由少数几个关键残基的相互作用来提供,含有关键残基的短肽可以模拟蛋白分子折叠产生的表位与其受体发生结合。由于噬菌体呈现的多肽能够与靶分子结合,因而通过亲和筛选可以从噬菌体随机肽库中筛选与靶分子结合的多肽,即让多肽模拟天然配体的结合部位与靶分子结合,直接测知配体与受体的结合位点。利用化学合成交叠肽的方法研究蛋白分子存在一定的局限性:仅能获得连续性表位的信息。而噬菌体肽库的多肽不仅可以模拟蛋白分子连续性序列构成的结合部位而且可以模拟非连续性序列经过折叠而构成的结合部位,因而同时获得所有表位的信息,并且反应均在液相进行,接近生物体内的液相环境,可较好反映实际情况。
基于此原理,利用噬菌体肽库技术已经确定了许多蛋白分子的相互作用位点,包括组成的SH3与酪氨酸蛋白激酶的结合位点[1]、胞浆蛋白p47phox与细胞色素b558的结合位点[2]、甲病毒属E2糖蛋白的血细胞凝集素激活区域[3]、蛋白酶抑制剂巨球蛋白α2与细胞膜受体的结合位点[4]等。除此之外,噬菌体肽库技术在研究酶在激活过程中亚基间的装配方面也显示出独特的优势。DELEO等人利用随机肽库研究了中性粒细胞NADPH依赖的氧化酶激活过程中亚基间的装配。NADPH氧化酶是多亚基蛋白,由胞膜上的细胞色素b和p91-phox、p22-phox及p47-phox亚基组成,其中p47-phox只是在细胞激活过程中才从胞浆移动到胞膜并与之结合。将gp91-phox和gp22-phox的序列与用p47-phox筛选噬菌体肽库得到的序列进行比较,发现存在同源性区域,揭示了它们之间的结合位点。以这些序列合成的游离多肽在体外试验中发现可抑制NADPH氧化酶的装配[5]。
另外,在分析蛋白结构的突变对功能的影响时,噬菌体肽库技术体现了自身的优势。构建针对某一蛋白分子的突变型肽库,即在编码这个蛋白的cDNA基础上,将某一区段的序列换成随机序列,这样可同时对数百个、甚至数千个的突变体进行分析,并找到亲和力最大、活性最高的突变体,弥补了点突变一次只能通过一个突变体来分析部分氨基酸的改变对其功能影响的不足。
蛋白质与DNA的相互作用一直为人们所关注,由于方法学的限制,对该领域了解甚少。锌指结构是与DNA结合的小型蛋白质结构模块,存在于大量真核转录因子中,了解分子特异性识别的模型有助于设计针对某一特定的核苷酸序列的高亲和力锌指蛋白分子[6]。Zif268是从鼠转录因子中获得的具有3个指结构域的锌指蛋白。Zif268与DNA的晶体结构发现每个指结构域以每3个碱基的间隔插入DNA双螺旋的大沟槽中,蛋白与DNA的识别是通过锌指结构侧链上4个氨基酸对密码子的识别。ISALAN等通过构建含Zif268与DNA结合区域的部分随机噬菌体肽库进行分析,发现如果将锌指结构邻近的氨基酸随机化,则可以消除上述选择性结合,提示锌指结构临近氨基酸可能决定了与不同序列的DNA结合。用含有Zif268结合位点的密码子筛选肽库,获得了高亲和力锌指结构模型。
3MHC多态性研究
抗原提呈中,抗原呈递细胞将摄入的抗原大分子在胞内降解为多肽,其中一些免疫原性决定簇与胞内MHCⅡ类分子相结合,运送到胞膜表面,形成修饰的复合物分子,以被CD4+T细胞识别。由于MHC结合的多肽存在着1个适于MHC结合的“序列模型”(基序),而这种基序的特异性正是MHC等位基因特异性的表现,因此可以通过不同MHC等位基因的“多肽结合基序”分析这种MHC等位基因的特异性。噬菌体随机肽库提供了模拟抗原多肽的来源,可以同时分析多个MHC等位基因的结合特性,寻找高亲和力多肽配体。例如,西部非洲不易感染疟疾 和B型肝炎病毒人群的DR13等位基因仅是HLA-DRβ链第86位的氨基酸不同,分别为缬氨酸和甘氨酸。用亲和纯化的HLA-DR13从噬菌体肽库中钓出与之结合的多肽,通过MHC与多肽的结合基序分析MHCⅡ分子的结合特点[7]。用3个结构相似的MHCⅡ分子筛库获得的3组表位序列既有共同点,也有各自的特点:第1位上都是Tyr残基,第4位上都是Met残基,每1组的第6位表现出等位基因特异性的保守残基。作者推测Tyr和Met都是锚定在3个MHCⅡ分子共有的2个“口袋”中,而噬菌体多肽第6位上的残基则与MHCⅡ分子等位基因特异性结合有关[8]。这类分析对于自身免疫性疾病的研究和疫苗的设计非常有参考价值。
4多肽药物筛选
在多肽药物设计和寻找过程中,肽库筛选是非常有应用前景的技术,它不仅提供了新的药理学导向来源,而且大大提高了筛选的工作效率。一般肽库含有107个不同的多肽,远大于传统医药工业筛选新药所用的数量;并且,从大量有机化合物中反复筛选、鉴别和纯化往往需要几年的工作量,费时、获率又极低。噬菌体肽库技术高效、方便的筛选使它在这一领域倍受青睐,已经得到了许多具有天然配体活性的多肽。其中最成功的例子是1996年WRIGHTON筛选到具有EPO功能活性的由二键连接的环形短肽。他用重组可溶性红细胞生成素(EPOR)先筛选与gpⅧ融合表达的构象约束型噬菌体八肽库,得到与EPOR特异性结合,且不与BSA、TNF的胞外区、神经生长因子(NGFR)、IR-2R(α、β和亚基)以及E选择素结合的环肽。此环肽虽能与EPO竞争结合EPOR,但亲和力较低。为了得到高亲和力多肽,进一步构建了多肽较长的突变型14肽库,并减少多肽在噬菌体表面呈现的价数,以此增大筛选强度。由此获得的环肽亲和力增加了10~50倍,虽然天然EPO在一级结构中无此序列,但体外和体内的一系列生物学实验均证明它们的确能模拟EPO;诱发受体形成二聚体、传导信号、触发生长和分化以及体内刺激网织红细胞的生成[9]。与此同时,有人测定了EPO模拟肽与EPOR复合
