李洁琼,李小万
(新疆农业职业技术学院,新疆 昌吉 831100)
昆虫产生大量的抗菌肽作为防御细菌、病毒、真菌或寄生虫的第一道防线[1,2]。在鞘翅目昆虫中,攻击素(Attacin)、天蚕素(Cecropin)、防御素(Defensin)以及鞘翅杀菌肽(Coleoptericin)等共同构成昆虫先天免疫防御体系[3]。Attacin家族广泛分布于昆虫不同种类,最初从天蚕中分离获得[4],在柞蚕[5]中Attacin可作为菌株鉴定的靶向蛋白,在橘小实蝇[6]成虫脂肪体中Attacin对细菌攻击的转录调节已得到证实,虫草蝠蛾的高通量RNA-Seq分析显示,Attacin与Cecropin,Gloverin和Defensin一起被鉴定为显著表达的抗菌肽[7]。
Attacin是一类富含甘氨酸的抗菌肽,按其等电点的不同划分为两大类:碱性攻击素(Attacin A,Attacin B、Attacin C、Attacin D)和酸性攻击素(Attacin E、Attacin F),大小范围为20~23 ku[4,8]。一般由5部分组成,包括信号肽、前肽、P域(富含脯氨酸的结构域)、N-末端Attacin域以及2个富含甘氨酸的结构域(G1域和G2域)[8]。Attacin溶解时呈无规则卷曲状态,由于水溶液中的无规卷曲结构不稳定且对蛋白酶敏感,Attacin的抗菌活性取决于其螺旋构象[9,10]。大部分Attacin可抵御大肠杆菌和一些特定的 革 兰 氏 阴 性 细 菌[4,8],其 通 过 直 接 靶 向 细 菌 外膜[11],或者通过与脂多糖结合而不穿过内膜或细胞质,阻止细菌外膜蛋白的合成,从而增加外膜的渗透性,抑制细菌的生长[12]。
新疆荒漠昆虫小胸鳖甲(Microderapunctipennis)是古尔班通古特沙漠的一种鞘翅目拟步甲科特有种[13]。它以成虫过冬,在早春季节冰雪尚未完全融化时就可交配产卵,具有很高的耐寒性以适应恶劣的沙漠环境[14],其潜在的分子基础仍然是未知的。在对小胸鳖甲经过4℃处理3 h所建立的低温转录组数据中[14],一些免疫相关转录物上调表达,其中MpAtt1和MpAtt2基因(GenBank登录号:KF825556和KF825557)显著上调表达[15]。果蝇中也发现Attacin基因响应低温上调表达[16-18]。这些免疫基因的差异表达是在无病原体诱导的情况下由冷胁迫引起的,这表明低温胁迫可能激活了昆虫体内的免疫防御体系,具体机制需要进一步研究。MpAtt1的推导氨基酸序列与MpAtt2有28.14%的同一性[15],本研究利用生物信息学方法,从理化性质、二级结构、疏水性、信号肽、跨膜区域、亚细胞定位、三级结构及结构域等多个方面对Mpattacin进行预测及分析,并与其他同源Attacin蛋白比对分析,为进一步研究小胸鳖甲Mpattacin基因功能奠定基础。
MpAtt1和MpAtt2核酸序列来自NCBI的Gen-Bank数据库,经DNAman软件翻译成氨基酸序列进行后续的生物信息学分析。
生物信息学相关分析利用在线分析软件完成(表1)。
表1 生物信息学在线分析软件
通过ExPASy-ProtParam预测Mpattacin基因编码的氨基酸的理化性质(表2),MpAtt1编码151个氨基酸,分子质量为16.611 65 ku。MpAtt2编码166个氨基酸,分子质量为18.162 06 ku。由预测结果可看出,Mpattacin为稳定的碱性蛋白。
表2 Mpattacin的理化性质预测
利用ProtScale分析蛋白质的亲水性/疏水性,负值越小表示亲水性越强,正值越大表示疏水性越强,介于-0.5~0.5的为两性氨基酸。从疏水性预测结果(图1a)可以看出,MpAtt1序列前有疏水性的信号肽序列,其余部分为亲水性序列,与ProtParam分析结果一致(表2)。经SignalP 4.1分析显示(图1b),预测的剪切位点位于17~18位氨基酸,表明MpAtt1蛋白的1~17位氨基酸可能为该蛋白的信号肽,属于分泌蛋白。MpAtt2序列也存在信号肽序列(图1c),信号肽的位置是1~17位氨基酸(图1d),其余部分为亲水性序列,与ProtParam分析结果一致(表2)。这2个Mpattacin抗菌蛋白多肽链亲水氨基酸分布比较均匀,且数量大于疏水性氨基酸,蛋白表现出亲水性,因此可推断这2个蛋白属于可溶性蛋白。
图1 Mpattacin蛋白信号肽、亲疏水性预测
利用TMpred分析蛋白质的跨膜区(图2),通常认为Score值大于500是可信的,MpAtt1序列第1~21位和MpAtt2序列第5~21位存在强烈信号,可能存在跨膜结构域,与信号肽分析和疏水性分析结果一致,且在蛋白序列的其他区域不存在高评分区域,表明上述2个蛋白质不存在跨膜区。
Porter分析结果显示(图3a),MpAtt1蛋白含有9个α-螺旋,80个延伸链和62个无规则卷曲;SOPMA分析结果显示,MpAtt1蛋白含有20个α-螺旋,46个延伸链和85个无规则卷曲。MpAtt2蛋白(图2b)经Porter分析含有16个α-螺旋,81个延伸链和69个无规则卷曲;SOPMA分析结果显示,MpAtt2蛋白含有17个α-螺旋,52个延伸链和97个无规则卷曲。这2个蛋白的二级结构由α-螺旋、无规则卷曲和延伸链(β-折叠)3种结构元件组成,其中,无规则卷曲和延伸链(β-折叠)所占比例较高,α-螺旋主要存在于信号肽处。
图2 Mpattacin蛋白跨膜结构域预测
图3 Mpattacin蛋白二级结构预测
同时利用YLoc、Tagert P、Cell-PLoc和ProtComp 9.0预测蛋白质亚细胞定位(表3),结果显示,MpAtt1和MpAtt2蛋白存在于细胞外的可能性较大,为细胞外的分泌蛋白。
表3 亚细胞定位分析
1)Mpattacin蛋白三级结构。通过Swiss-Model和CPHmodels3.2预测Mpattacin三级结构,并采用Swiss-Pdbviewer进行模型展示。结果表明,MpAtt1(图4a)和MpAtt2(图4b)蛋白主要由延伸链(β-折叠)和无规则卷曲这2种元件构成,与二级结构预测结果对应。
图4 Mpattacin三级结构模型
2)Mpattacin蛋白保守结构域。利用SMART分析Mpattacin蛋白保守结构域的结果表明,MpAtt1氨基酸序列38~151位点为Pfam domain—Attacin_C(ID:PF03769),E值为3.4×10-12,且32~145位点为Gloverin domain(ID:PF10793),E值为2.3×10-3;同时,MpAtt2蛋白同样含有Attacin_C功能域(43~166位点)以及葛佬素功能域(38~165位点)。利用NCBI的Conserved domain database数据库分析显示,MpAtt1和MpAtt2氨基酸序列46~147位点和51~166位点为Attacin、C-terminal region(ID:cl04253/pfam 03769),E值分别为5.97×10-08和3.79×10-29,这表明Mpattacin蛋白具有典型的昆虫抗菌肽Attacin_C保守结构域,隶属于Attacin_C超家族,同时又具有抗菌蛋白葛佬素Gloverin保守结构域。
3)Mpattacin蛋白基序分析。利用PROSITE分析Mpattacin的MOTIF,结果如表4所示,MpAtt1和MpAtt2的蛋白质均具有相似的MOTIF:蛋白激酶C磷酸化位点、酪蛋白激酶II磷酸化位点和N-肉豆蔻酰化位点。
表4 Mpattacin的基序预测分析
4)Mpattacin蛋白糖基化和磷酸化位点。利用在线工具NetOGlyc4.0 Server预测Mpattacin潜在糖基化位点,MpAtt2在氨基酸41(0.528)和42(0.543)处可能存在O-糖基化位点,MpAtt1不存在糖基化位点的概率较高。利用NetPhos 3.1 Server分析Mpattacin潜在磷酸化位点,磷酸化位点预测阈值选择分值大于0.5,MpAtt1(图5a)和MpAtt2(图5b)序列可能存在较多的磷酸化修饰,特别是C端,且分别位于丝氨酸(Ser)、苏氨酸(Thr)和酪氨酸(Tyr)3种氨基酸上,其中,丝氨酸(Ser)上潜在的磷酸化位点数最多,这与功能域和MOTIF预测结果一致。
图5 Mpattacin磷酸化位点分析
从NCBI数据库下载已经报道的部分物种Attacin蛋白序列,同源性分析表明,与鞘翅目光滑鳖甲抗菌肽Attacin1(登录号:APX53001.1)一致性最高,为84.77%(表5)。
表5 与Mpattacin比对的其他同源Attacin蛋白的序列信息
小胸鳖甲MpAtt1和MpAtt2在氨基酸水平与鳞翅目、双翅目和鞘翅目昆虫的Attacins具有35.05%~84.77%的一致性,可知鞘翅目昆虫的Attacin与来自其他2个目的昆虫Attacin序列之间具有较大差别。系统发育树分析也表明,鞘翅目昆虫小胸鳖甲的Mpattacin和赤拟谷盗的Attacin,与鳞翅目和双翅目的Attacin相比分枝较早[15],与这些昆虫之间的分类进化关系一致。Attacin溶解时呈无规则卷曲状态[9],由于缺乏半胱氨酸所形成的二硫键,其构成的三维结构是松散和不稳定的,这种对结构无严格的限制可能会导致氨基酸替换的增加,这可能是导致远源物种的Attacin氨基酸序列相似性低的原因之一。
Mpattacin的氨基酸序列与其他昆虫Attacin不同,富含脯氨酸的P域几乎丢失;N末端结构域大大缩短;G1结构域比其他Attacin的短;其中MpAtt1的碱性氨基酸蛋白酶(furin-like enzyme)RXXR酶切位点变化非常大[15],因此难以通过序列的同源性分析Mpattacin蛋白的生物活性。而影响抗菌肽生物学特性的因素有很多,其中,肽链长度、电荷数与分布、氨基酸空间结构及组成、疏水性及亲水性特点等是主要的自身决定因素[19]。MpAtt1和MpAtt2的等电点(pI)分别为9.57和8.71,属于基础Attacin类[4]。大多数昆虫抗菌肽AMP是带有阳离子的蛋白质,具有抗细菌活性的碱性残基,因此可以通过电荷间相互作用促进AMP与带负电荷的微生物表面的结合[10,20]。抗菌肽通常理化性质稳定,具有较好的耐热性和耐酸碱性[21]。借助相关生物信息学在线软件分析表明,Mpattacin也具有上述特性,这也意味着这些特性是Mpattacin具有活性的基础。
蛋白质中氨基酸的疏水性和亲水性的分布情况决定了该蛋白质如何折叠。分析预测Mpattacin蛋白质具有高疏水值的信号肽序列区域,并出现在潜在的跨膜区,其余部分为亲水性序列,无跨膜结构,表明Mpattacin在折叠的过程中形成了亲水的表面以及疏水的内核,是亲水性蛋白。亚细胞定位结果也显示,MpAtt1和MpAtt2蛋白为细胞外的分泌蛋白,表明该蛋白符合昆虫抗菌肽Attacin的特性[4,8]。有报道表明,抗菌肽在插入到菌体细胞膜的过程中,其疏水特性起了关键作用[22],即改善疏水性可提高抗菌肽的抗菌活性。尽管Mpattacin在总体上是亲水性的,但在其序列中也包含一些疏水性的残基位点,这也可以提高Mpattacin的抗菌活性。
蛋白质主要的生化特征及功能是由多肽链进一步螺旋、折叠和卷曲而形成的高级空间结构来决定的。二级结构和三级结构预测结果显示,Mpattacin蛋白存在较多的β-折叠和无规则卷曲,少量的α-螺旋结构。β-折叠位于蛋白质内部,能够牢固地维持该蛋白的高级结构。无规则卷曲则常展示在蛋白质表面,有利于抗原抗体的相互作用[23]。有研究表明,抗菌肽的α-螺旋结构有助于透过和破坏细菌的细胞膜[24]。通过保守结构域的分析可知,MpAtt1和MpAtt2都具有Attacin_C结构域和Gloverin域,这2个结构序列均与抗菌活性有关[3]。且Mpattacin存在较多的磷酸化潜在位点,特别是在C端,从而有利于该蛋白质与昆虫体内其他分子或蛋白相互作用而调控细胞的应答功能。一般来说多肽链中的氨基酸潜在的磷酸化位点越多,发挥更多功能的可能性就越大。已经从许多昆虫中鉴定出具有抗微生物活性的Attacin[4,11,25,26],此外果蝇的研究表明,反复冷暴露后抗菌肽Attacin(AttacinA、AttacinB和AttacinC)上调表达[16];冷驯化的果蝇中也发现编码抗微生物肽的Dro、Dipt、AttA和AttC上调[17];低温下果蝇中编码抗菌肽的AttA、AttB、DptA、DptB、CecA1和CecA2转录上调以响应过冷却现象,AttD下调以响应体液结冰[18]。起初是在分析小胸鳖甲低温转录组数据时发现低温诱导表达Mpattacin基因,并在4℃和-4℃低温下检测MpAtt1和MpAtt2的表达谱,在一段时间长度(0~11 h)内得到证实[15]。本研究通过多个方面预测结果相互验证,分析得出Mpattacin蛋白可能具有较好的抗菌活性,参与到昆虫的体液防御系统。在低温下免疫通路的激活及其调控抗菌肽基因的表达,一定程度上增强了昆虫胁迫耐受性和免疫防御能力[18]。对于越冬期的小胸鳖甲来说,在没有病原体胁迫的情况下,Attacin基因的表达对寒冷产生响应,表明低温诱导表达Attacin蛋白可能是昆虫进化出的一种低温保护机制[27]。本研究对Mpattacin基因生物信息学分析有助于进一步开展克隆表达及功能分析方面提供理论参考。