冯东晓 刘德培(综述) 梁植权(审阅)
摘要 人α-类珠蛋白基因簇位于6号染色体的短臂近端粒区,由4个功能基因和3个假基因组成,其中,ξ-珠蛋白基因在胚胎期表达,α2、α1和θ珠蛋白基因在胎儿和成人期表达。α-类珠蛋白基因的主要调控序列位于ξ-珠蛋白基因上游40kb的位置,称为HS-40,另外还存在其它的HS位点。在HS-40和各种珠蛋白基因启动子上有多种红系和通用反式作用因子的结合位点,它们间的协同作用保证了α-类珠蛋白基因表达的组织和时序特异性。对于α-类珠蛋白基因表达调控的研究主要采用转基因动物和细胞转染的方法。
关键词: α-类珠蛋白基因 HS-40 基因表达调控
血红素结合蛋白是一类广泛存在的蛋白质,从细菌、真菌、软体动物到植物和脊椎动物细胞内都有分布,功能也各不相同,但是它们都来自共同的始祖基因。血红蛋白在体内承担着运输氧气和CO2的生理功能,每个红细胞约含2.8亿个血红蛋白分子,是红细胞中的主要蛋白质。人从胚胎、胎儿、新生儿到成年整个发育过程中,共有HbGower I (ζ2ε2)、HbGower Ⅱ (α2ε2)、HbPortland(ξ2γ2)、HbF(α2γ2)、HbA2(α2δ2)和HbA(α2β2)六种血红蛋白出现,其α类和β类由两种不同的珠蛋白多肽链和血红素分子构成,其中α-类珠蛋白基因包括ξ、α2、α1和θ,β-类珠蛋白包括β、δ、ε和γ。α-类珠蛋白与β-珠蛋白的同源性为50%,空间结构相似,大约在5亿年前由共同的始祖基因进化而来。
人的α-类珠蛋白肽链共有4种,ξ基因与α基因在大约4亿年前开始分离,θ基因与α基因的分离发生在2.6亿年前。其多肽链均由141个氨基酸残基构成,在胚胎第一天,主要是ξ多肽链(42%)和α2多肽链(24%)的表达,从第五周起ξ珠蛋白基因的表达开始关闭,而代之以α2和α1珠蛋白基因的表达,与β类珠蛋白基因相比,α类珠蛋白基因只有一次开关(switch),其表达调控机制可能较为简单,在研究基因表达的时序上是一个更好的模型。而且,α-地中海贫血的发病率在我国也较高,在广西高达14.9%,广东为4.11%,因此,研究α类珠蛋白的基因表达调控,对于了解α-地中海贫血的发病机理和选择有效的治疗方法,都有重要的意义。
1 α类珠蛋白基因簇的结构特点
人的α类珠蛋白基因簇位于16号染色体短臂靠近端粒的位置,长度约为26kb,与端粒的距离为170kb-340kb,具有多态性[1]。小鼠的α类珠蛋白基因簇位于11号染色体近着丝粒的位置。整个α类珠蛋白基因簇在进化上是非常保守的,共有7个基因组成,包括4个可编码基因和3个假基因:端粒-ξ-ψξ1-ψα2-ψα-α2-α1-θ1-着丝粒。另外,在人的第22号染色体上还发现了一个ψθ珠蛋白基因的拷贝。与β-珠蛋白基因簇相比,α类珠蛋白基因簇的基因密度较高,G+C含量较高(54%),Alu序列的密度也很高(占整个序列的26%),另外还含有一些数目可变的串联重复序列(VNTRs)和CpG岛。
由于人α类珠蛋白基因簇位于16号染色体近端粒区,在DNA复制起始的早期即开始复制,所以在各种细胞中染色体结构始终处于开放状态,CpG岛也保持未甲基化,但是其表达却是红系特异的。小鼠α-珠蛋白基因簇位于其11号染色体近着线粒位置,在染色体位置和结构上与人存在较大差异,只在红系细胞中呈现开放状态,没有CpG岛。小鼠α-珠蛋白基因簇附近存在许多与端DNA同源的序列,说明小鼠α-珠蛋白基因簇可能是从小鼠染色体的端粒红色转位到现在所处的位点[2]。
在α-类珠蛋白基因簇和端粒间存在4个看家基因(housekeeping gene)和一个IL-9受体的假基因,在人16号染色体上的位置依次是:端粒-ψIL-9-未命名-Dist1-MPG-Pros1-ξ-,MPG编码一种DNA修复酶:3-甲基腺嘌呤DNA糖苷酶,转录方向与α类珠蛋白基因簇的转录方向一致,而Dist1和Prox1的转录方向与α类珠蛋白基因簇的方向相反,分别位于α珠蛋白基因上游-89/-91kb和-14kb的位置,因此又分别被称为-89/-91基因和-14基因。3种基因的表达都不是红系特异的,人的MPG和Prox1基因的在3’-端有重叠,小鼠没有重叠[3]。α珠蛋白基因特异的增强子序列HS-40就位于Prox1基因的第5内含子中。
2 调控α类珠蛋白基因表达的上游顺式反应元件和反式作用因子
人α类珠蛋白基因簇上游40kb的一个DNase I高敏位点(HS-40)是已知最重要的α类珠蛋白上游表达调控序列,虽然在ξ基因上游也存在其它的DNase I高敏位点,如HS-33、HS-10、HS-8和HS-4[4],类似于β-LCR5个DNase I高敏位点排列方式,但都没有HS-40对α类珠蛋白基因的增强子活性,最新的研究发现,HS-40对α-珠蛋白基因的表达还有负的作用,因此早期α-LCR的定义是不确切的,现在一般叫做α-主动控制元件(positive control element)或α-位点调控元件(locus regulatory element)[5]。
HS-40序列长约300bp,在这希区域内集中了多种组织特异和广泛存在的反式作用因子的结合位点。在10bp、100bp、270bp和290bp处存在4个红系特异的GATA盒,在120bp和150bp处有两个NF-E2/AP1的结合位点(GCTGAG/CT-CA),以及3个CACCC盒和一个AG盒。在第二个GATA盒和第一个NF-E2/AP1结合位点中间有一个YY1结合位点,另外,与第一个CACCC盒重叠的一段GGGCGG序列[6]。HS-40增强子的缺失对MPG基因的表达没有影响,只引起α类珠蛋白表达的降低,造成严重的α-地中海贫血。但是α珠蛋白所呈较低水平的组成性表达,这与人α-珠蛋白所处的染色体位置有关,因为α类珠蛋白基因簇靠近染色体的端粒,始终处于开放状态,允许较低水平转录合体的形成。
小鼠HS-40的同源序列位于ξ-珠蛋白基因上游26kb,核心序列的长度约为270bp,也位于鼠Prox基因的内含子内,有3个GATA盒、两个NF-E2/AP1结合位点和一个YY1的结合位点,但是与人HS-40相比,缺少CACCC盒和3’-端的一个GATA盒。在MEL中,HS-26不能促进人α-珠蛋白基因科长的表达调控机制是不同的[7]。(图1)
图1 人HS-40和小鼠HS-26结构示意图
NF-E2蛋白是一种重要的红系反式作用因子,是由分子量分别为45kD(p45)和18kD(p18)的两类亚基构成的异二聚体,它们都是属于AP-1基因超家族的含碱性亮氨酸拉链的蛋白,p45亚基只在各种造血细胞中有表达,而p18亚基几乎在各种组织中均表达,其中人mafG的表达与珠蛋白的调控有关。缺失NF-E2基因的MEL细胞不能促进α类和β类珠蛋白基因的表达,但是NF-E2敲除的小鼠并未出现红系发育和分化的异常,进一步缺失NF-E2蛋白相关因子(Nrf-2)基因也未能引起红细胞成熟的缺陷,而且NF-E2和Nrf-2间也不存在相互调控的现象,推测新近发现的这一家族的BACH-1和BACH-2基因可能起更重要的作用[8]。GATA-1和EKLF也是重要的红系反式因子,它们在DNA分子上的结合基序分别是(A/T)GATA(A/G)和CACCC[9],在红系细胞的分化和基因表达过程中起着关键的作用,GATA位点的突变会使红系的分化终止。GATA-1和EKLF都可以通过锌指结构与其它蛋白因子相互作用而形成核酸-蛋白复合物,GATA-1位点一般是成对出现。GATA-1发挥作用时需要辅助蛋白FOG(friedn of GATA-1)的存在,FOG的缺失也会造成红系分化的终止[10]。
YY-1和X-BP蛋白在HS-40上也存在结合位点,它们虽然不是红系特异的反式因子,但是对HS-40的增强子活性都有重要的作用。另外,在α-珠蛋白基因簇的3’-下游区域内存在的GATA-1结合位点可能对α-珠蛋白基因的表达也具有重要作用,包含α1基因在内的α2基因下游20kb的缺失也使α2基因不能表达,检测发现,虽然ξ和α2基因是完整的,HS-40也正常,但患者还是表达严重的α-地中海贫血。这可能也与α-珠蛋白基因簇的完整性有关[11]。
3 α-类珠蛋白基因的表达
α-类珠蛋白基因的表达具有红系组织特异性和不同发育阶段的特异性,与β-类珠蛋白相比,只有一个开关,即胚胎期ξ基因向胎儿/成人期α基因的转换。位于基因簇的5’-端的ξ基因在卵黄囊期首先开启表达,同时3’端的α基因表达也开启,但是水平较低。它们与同时表达的胚胎期β类珠蛋白共同构成两种胚胎血红蛋白。人ξ基因的表达水平随胚胎的发育逐步降低,至第五、六周造血功能从卵黄囊转移到胎肝后,ξ-基因的表达基本关闭(小鼠的转换发生在9-11d),而α基因开始活跃表达。这时ξ基因也存在低水平的渗漏表达,在成人期仍可以检测到ξ基因的痕量表达。α基因有两个拷贝,编码的氨基酸序列完全相同,但是在编码区有两个碱基的替代,第二内含子上有7bp的缺失,3’-非翻译区也存在一定的差异。在成人外周血红细胞中,α2和α1mRNA的比例是2.6:1,说明它们的转录效率是有差异的,但是翻译水平的差异无法确证,因为两个基因所编码的多肽链是完全相同的。事实上两个α基因在发育过程中也存在一个转换,在胚胎早期,α2和α1mRNA的比例接近1:1,α2基因的表达逐渐占优势,到第8~10周达到2.6:1的比例[11]。在K562细胞中α2和α1 mRNA的比例发生异常,只有8:29,经氯高铁血红素诱导后比例有所增加,如果将K562细胞的16号染色体导入MEL细胞,则恢复正常
