长链非编码RNA分子作用机制研究进展

2021-12-08 20:05:52郭东光陈明艳李文明郭赞莹孙国鹏朱艳平王选年
河南农业科学 2021年4期
关键词:特异性编码调控

郭东光,陈明艳,李文明,2,王 丰,郭赞莹,孙国鹏,李 鹏,岳 锋,朱艳平,王选年

(1.新乡学院 生命科学与基础医学学院/动物疫病分子诊断河南省工程实验室,河南 新乡 453000;2.郑州大学 生命科学技术学院,河南 郑州 450000)

随着转录组测序技术的不断发展,约70%的基因组被认为是可以转录,但大部分为长链非编码RNA(Long non-coding RNA,lncRNA)[1]。研究显示,在人类基因组中存在约5.8万个lncRNA,并且很多尚未经过功能验证,被认为只是作为转录“噪音”存在[2]。研究发现,lncRNA在基因转录和蛋白质表达中仍表现出其特异性的调节功能[3]。为此,综述了lncRNA分子作用机制方面的相关研究内容,如与DNA、RNA和蛋白质的相互作用,以及RNA编辑和修饰及其在免疫调节方面的影响等内容,为深入了解lncRNA的分子作用机制及其生物学调节功能提供参考。

1 lncRNA的定义和分类

lncRNA是缺乏开放阅读框架,且长度大于200 nt不编码蛋白质的转录本[4-5]。按照是否大于200 nt,将非编码RNA(Non-coding RNA,ncRNA)分为短链非编码RNA和lncRNA,这种区分可以很容易将lncRNA与tRNA和miRNA(microRNA) 等不同功能的小RNA区分开。根据lncRNA相对于编码蛋白和信使RNA(mRNA)基因座的位置及基因增强子调控元件,又分为基因间长链非编码RNA(Long intergenic non-coding RNA,lincRNA)、内含子lncRNA、反义lncRNA和增强子RNA(eRNA)。与mRNA一样,多数lncRNA都有帽子结构、剪接体和多聚腺苷酸尾巴[6]。相比之下,eRNA通常是由主动增强子元件双向转录而来,虽然没有剪接体和多聚腺苷酸尾巴,但也具有帽子结构[7]。然而,一些从调控元件转录的RNA是单向多聚腺苷酸化的。因此,进一步将RNA分为1d-RNA(单向多聚腺苷化)或2d-RNA(双向的非聚腺苷化,长度相对较短)[8]。环状RNA(circRNA)作为线性转录本的主要亚型,其通过自身3′和5′末端相连接后反向剪接而成,且不具有帽状结构和多聚腺苷酸化尾巴。迄今为止,已经在人类基因组中发现了数千种circRNA[9]。

2 lncRNA的调节作用机制

随着对lncRNA生物学调节功能研究的不断深入,lncRNA调节作用的重要性已逐渐阐明。如长链非编码RNA X染色体失活特异性转录本基因(lncRNA Xist)对X染色体的沉默作用[10-11];lncRNA H19在基因印记中的调节作用[12];lncRNA-RoR(Regulator of reprogramming)在胚胎干细胞(Embryonic stem cell,ESC)分化中的调节作用及lncRNA HOTAIR对乳腺癌转移的调节作用等[13-14]。与其他类型RNA相比,lncRNA没有主要的分子原型,主要以模块化结构域的形式通过核酸碱基配对与DNA或RNA相互作用,或通过RNA高级结构与蛋白质相互作用[15-16]。此外,lncRNA自身的转录也可通过改变染色质可接近性或诱捕靶基因启动子上的转录因子发挥调节功能[17]。

2.1 lncRNA与DNA相互作用

研究发现,多数lncRNA的调节功能是通过识别特定染色质特征或RNA-DNA异源双链或RNA-DNA-DNA三链来调节邻近(顺式)或远距离(反式)靶基因座的转录[18]。lncRNA可以与启动子序列形成稳定的双链,也可与成纤维细胞核糖体DNA启动子形成三链体结构[19-20]。此外,lncRNA本身的转录可引发局部染色质的变化,但该变化并非由非编码转录本所介导[21]。在一项分析12个lncRNA介导的局部基因调控机制研究中发现,虽然有5个lncRNA以顺式作用调控相邻基因的表达,但并不需要lncRNA转录本自身,而是依赖与其转录的相关过程,包括lncRNA启动子增强子活性、lncRNA的转录或剪接等[22]。

2.2 lncRNA与RNA相互作用

lncRNA也可通过RNA-RNA相互作用发挥其调节功能,如lncRNA EBER2通过与爱泼斯坦巴尔病毒(Epstein barr virus,EBV)基因组末端重复位点(Terminal repeats,TR)的新生转录本杂交,将转录因子PAX5募集到TR中以调控TR附近基因的表达和病毒的裂解及复制过程[23]。RNA结合也是circRNA主要调节机制:一是以碱基配对的形式降低伴侣RNA转录本的稳定性,主要以 circRNA对miRNA的调控为主;二是作为miRNA“海绵”,通过竞争转录机制选择性降低RNA转录本的转录效率。除此之外,circRNA还可从其功能基因靶点准确“滴定”miRNA,如circRNA ciRS-7可以通过与miR-7结合的70个位点准确“滴定”miR-7的拷贝数,在中脑发育过程中发挥着重要调节作用[24-25]。其调节机制是,ciRS-7可以完全抑制miR-7介导靶蛋白不稳定性,并通过抑制miR-7使其靶向调节蛋白表达丰度显著上调。此外,circRNA Sry作为miR-138的“海绵”,可以抑制睾丸中miR-138靶蛋白的翻译[24]。可见,缺乏5′和3′末端的circRNA具有比线性RNA更强的稳定性。

2.3 lncRNA与蛋白质相互作用

lncRNA可以调节各种生物大分子的活性,其主要机制是单个lncRNA包含多个与DNA、RNA和蛋白质结合的模块化结构域。其中,DNA结合和蛋白质相互作用的模块化配对是lncRNA发挥调节功能的一个重要机制,以招募通过化学修饰组蛋白调节基因表达的染色质修饰蛋白[26]。如Xist结合多梳抑制性复合物(Polycomb repressive complex)后通过修饰抑制性组蛋白的位置可使非活性X染色体沉默[27]。lncRNA HOTTIP可通过与MLL组蛋白H3 Lys4(H3K4)-甲基转移酶复合物的核心亚基适配体WDR5结合来维持基因转录[28]。在免疫调节方面,lncRNA也可以与核糖核蛋白结合直接调节染色质的可接近性、转录及细胞质中蛋白质的表达来调控病原体反应受体下游信号通路[29-30]。

另外,eRNA和circRNA也可通过与蛋白质的相互作用来调控基因表达。如eRNA可在启动子近端元件结合转录因子YY1以稳定转录因子在靶基因组位点的占有率,通过RNase处理的染色质可以减少启动子位点对这种功能性蛋白的捕获,而使用 CRISPR-Cas9技术将eRNA与YY1结合位点相连,则可以增加YY1的占用率[22]。进一步分析发现,其与RNA聚合酶Ⅱ(RNA polymerase Ⅱ)的相互作用是其提高基因转录效率的主要机制[31]。此外,测序分析结果表明,与RNA聚合酶Ⅱ结合的大约有100个circRNA,而且多数是外显子-内含子circRNA,还包含一定数量的尚未剪接的全长转录本,并且其主要通过与小核糖核蛋白U1相互作用而增加其亲本剪接的mRNA转录[31]。

3 lncRNA表达的细胞特异性

前人研究结果显示,lncRNA表达的细胞特异性与它们在组织中的特异性功能密切相关,如在皮肤成纤维细胞中特异性表达的lncRNA HOTAIR,对调控皮肤细胞位置同一性所必需的HOX编码基因的表达至关重要[32]。在角质细胞分化过程中显著上调的终末分化诱导lncRNA(Terminal differentiation-induced lncRNA,TINCR)可诱导与屏障形成相关基因编码产物的表达[33]。此外,在ESC中共鉴定出226个特异性表达的lncRNA,约90%的lncRNA对ESC中的基因表达都具有显著影响,而且每缺失一个lncRNA,大约会影响到175个蛋白质编码基因的转录。更为重要的是,这些特异表达的lncRNA可与染色质调节因子相互作用以维持ESC多能性并抑制其向终末细胞系的分化进程[34]。

此外,在免疫细胞中,通过分析40多个小鼠T细胞群体的表达发现,共鉴定出1 500个lncRNA的表达,约有50%是以T细胞亚群特有的方式表达。相比之下,只有6%~8%的mRNA具备这种细胞特异性[35]。而通过在不同人淋巴细胞中的研究,也获得了相似结果,约有70%lncRNA在淋巴细胞中呈现特异性表达[36]。这些结果表明,细胞中特异性lncRNA的表达对细胞特异性功能的发挥至关重要。

4 lncRNA的编辑和修饰

RNA编辑和修饰是表观转录组学的重要组成部分,揭示了RNA在细胞变化和信号基础上的动态调节机制[37]。实际上,绝大多数RNA分子在转录过程中或转录后的整个生命周期中都会经历某种形式的编辑或修饰过程,相比于修饰前,这些特定修饰或碱基改变会明显影响其功能,主要包括蛋白质的募集、碱基突变读出氨基酸的改变以及对RNA高级结构的调整等[38]。从免疫学角度来讲,RNA分子同样处于免疫监视之下,RNA分子的化学修饰会影响其免疫原性和功能,并且通过对特异位置的精确修饰可将RNA标记为非致病性分子,这样可以有效屏蔽细胞感受器中的核酸抑制其对RNA的免疫反应[39]。此外,RNA编辑和修饰的紊乱对细胞表型变化及其发育都有重要调节作用[40]。

4.1 lncRNA的编辑

哺乳动物中最常见的RNA编辑类型是在内含子或基因间区发现的Alu元件中腺苷脱氨基转变为肌苷[41]。由于腺苷和肌苷有不同的碱基配对偏好,因此RNA编辑可以通过在体内解开之前的双链区而改变RNA结构,这样可有效消除触发自身免疫的识别模式。因为胞质RNA传感器(如MDA5)可将长双链部分识别为病原体[42]。虽然,大多数RNA编辑发生在蛋白质编码基因(65%的mRNA)中,但也有一部分发生在ncRNA(10%)中[43]。例如腺苷脱氨酶(Adenosine-deaminase,ADAR)家族的酶催化腺苷到肌苷的脱氨作用涉及2个活性成员,存在于细胞核和细胞质中的ADAR1及仅在细胞核中发现的ADAR2[43-44]。研究发现,这些酶的表达失调与多种疾病有关,包括精神分裂症、肌萎缩侧索硬化症和癌症[45-47]。此外,研究还证实,ADAR酶缺失的小鼠有明显的不利表型存在,表明RNA编辑是正常细胞分化过程的必经阶段[48]。

除此之外,根据ADAR疾病表型的影响及其lncRNA表达的组织特异性发现,ADAR广泛参与细胞生物学功能过程的调节[49]。尤其是lncRNA上脱氨基反应可改变lncRNA与miRNA结合的能力,是RNA编辑调控基因表达的重要机制。其中,lncRNAPCA3就是典型的例子,ADAR可作用于PCA3及其反义基因PRUNE2所形成的复合物来调节PRUNE2基因的表达。因PCA3-PRUNE2复合物还对雄激素受体的激活非常敏感,并且可调节细胞增殖和转化,ADAR通过调节PCA3与PRUNE2形成复合物的能力影响前列腺癌的进展[50]。此外,ADAR1的编辑也可以通过调节B细胞系的发育过程来调节细胞对外来核酸的监测和干扰素应答反应[51]。

由于ADAR靶向外显子侧翼的内含子区域,可将其剪接形成circRNA,因此ADAR还与circRNA的表达丰度有关。然而,一旦ADAR对内含子中的双链区域过度编辑,则可导致circRNA表达降低[52]。此外,Alu元件也同样存在于内含子中,并受到ADAR酶的靶向调节。因此,腺苷-肌苷编辑的频率取决于有多少ADAR酶存在,而ADAR表达的变化也与RNA编辑和circRNA产生的动态变化密切相关。 目前,已经鉴定出超过100多种修饰现象,且主要集中在rRNA和tRNA[53]。

4.2 lncRNA的修饰

哺乳动物中lncRNA和mRNA最常见的修饰是N-6甲基腺苷(N6-methyl-adenosine,m6A)修饰,这种修饰与许多细胞功能相关,包括翻译、剪接、定位、稳定性、分化、再生和免疫等调节功能[54]。此外,m6A修饰的位置具有明显的序列特异性,并且在5′非翻译区、终止密码子和3′非翻译区附近富集。m6A是一种动态的修饰过程,在脊椎动物中METTL3和METTL14是添加这种修饰复合物的核心组分,而含有YTH 区域、核糖蛋白hnRNPC和翻译起始因子eIF3的蛋白质能够识别这种修饰或其相应的二级结构变化[55-56]。与m6A修饰有关的一个重要因素是m6A诱导了RNA二级结构的变化,每个m6A通过在RNA双链上施加1.5 kcal/mol的自由能,使之更有利于RNA单链构象的形成[57-58]。此外,在免疫功能上,RNA双链到单链的转换也打开了RNA与蛋白质的结合位点,降低了触发先天免疫的双链RNA区域的表达丰度。

在哺乳动物免疫系统中,m6A修饰的重要细胞功能之一是发出RNA非致病性信号,类似于包括来自ADAR活性的肌苷。如体外产生转录本上m6A修饰的存在可阻止对Toll样受体(Toll-like receptors,TLR) TLR3、TLR7和TLR8的识别,而未修饰的转录本则可识别这3个受体[59]。当体外合成的转录本刺激树突状细胞(Dendritic cell,DC)来源的细胞因子时,会导致含m6A的RNA诱导的TNF和IL-12相对较少。然而,不同的是,在含有m6A的转录本上刺激原代DC可分泌TNF,但是在同一转录本上如果加入假尿苷(Ψ)则可消除这种反应,这表明原代DC对m6A和Ψ有不同的识别途径。此外,RNA的m6A修饰可降低来源于单核细胞DC诱导细胞表面表达CD80、CD83、CD86和主要组织相容性复合物Ⅱ(Major histocompatibility complex class Ⅱ)类分子的能力,并且其诱导DC分泌细胞因子的能力还与细胞亚类和修饰的性质和水平密切相关[59-60]。

5 lncRNA在动物方面的研究及应用

近年来,随着高通量测序技术的飞速发展,lncRNA在动物方面的研究也有很多相关报道。如在调节肌肉分化方面,lncRNA TCONS_00815878和lncRNA-MEG3可以调控猪骨骼肌的生长和发育,并认为可能是改良猪生产性能的重要调控基因[61-62]。lncR-125b可通过竞争性结合miR-125b来调控IGF2的表达,在羊骨骼肌分化过程中发挥着重要调节作用[63]。此外,lncRNA的高通量测序结果表明,lnc_011371、lnc_007561 和 lnc_001728在山羊骨骼肌的不同发育阶段可能发挥着重要调节作用[64]。为研究lncRNA在肉牛分子育种中的作用,已证实lncRNA MDNCR和lncRNA-MEG3可分别通过竞争性结合miR-133a[65]和miR-135[66]促进牛骨骼肌成肌细胞分化和抑制成肌细胞增殖。

另外,lncRNA在动物脂肪沉积中也发挥着重要调控作用,通过对秦川牛脂肪组织中lncRNA的研究发现,lncRNA在牛不同年龄阶段脂肪沉积过程中具有重要作用[67]。另一项在牛脂肪细胞中的研究结果表明,lncRNA ADNCR 通过靶向调节Sirt1可以抑制牛脂肪细胞分化[68]。对莱芜猪(LW)和大白猪(LY)的肌内脂肪lncRNA表达谱分析和生物信息学研究结果显示,XLOC_046142、XLOC_004398 和 XLOC_015408等 3个lncRNA可能在猪肌内脂肪生成和脂肪沉积过程中起着重要的调控作用[69]。研究证实,LNC_000414被认为是与猪肌内脂肪生成密切相关的lncRNA,可以抑制猪肌内脂肪细胞的增殖和分化[70]。此外,lncRNA在动物毛囊发育[71]、动物疾病调控[72],以及在水产动物的生殖、胚胎发育、性别分化、免疫和代谢等[73]方面都发挥着关键调节作用。

6 小结与展望

近年来,随着对lncRNA研究的不断深入,发现其作用机制比miRNA更加多样,且生物学功能非常强大,已成为表观遗传学领域一个新的研究热点。lncRNA通过顺式作用、反式作用和染色质修饰、染色质重塑等过程,影响了基因表达的激活和抑制。更为重要的是,单个lncRNA可以通过模块化结构域发挥调节功能,经常通过与DNA或RNA的相互作用将蛋白质活性与DNA或RNA靶点联系起来。至今,已经发现许多人类和动物性疾病都与 lncRNA表达紊乱有关,随着研究的广泛开展与深入,lncRNA相关生物学效应及其分子机制将进一步得到阐明,并为疾病的诊断和治疗提供新的思路和靶点。因此,随着对lncRNA的深入研究,新的作用机制和新的生物学调节功能将会被发现,可为进一步治疗人类和动物相关疾病以及在畜牧业中改善动物的生产性能提供指导。

猜你喜欢
特异性编码调控
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
电子制作(2019年22期)2020-01-14 03:16:24
如何调控困意
经济稳中有进 调控托而不举
中国外汇(2019年15期)2019-10-14 01:00:34
Genome and healthcare
精确制导 特异性溶栓
顺势而导 灵活调控
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
重复周围磁刺激治疗慢性非特异性下腰痛的临床效果