陈 伟,刘晓艳,朱 镭
(湖北省农业科学院湖北省生物农药工程研究中心/国家生物农药工程技术研究中心/湖北省农业科技创新中心生物农药分中心,武汉 430064)
硫元素循环是硫元素在地球生命系统与非生命系统间的动态转换、迁移过程,是生物地球化学的基础循环之一[1]。硫元素循环的初始驱动是硫酸盐还原细菌(Sulfate-reducing bacteria,SRB)及古菌在厌氧环境下利用硫酸盐代替氧气作为电子传递受体,产生生命活动所需的能量以及硫化氢产物。在地球演化史中,该生命活动的出现更早于氧气大爆发事件[2]。SRB广泛存在于自然界中,尤其是在各类水体的底泥环境中扮演着推动硫还原的角色。因此,在农业水产养殖领域,SRB的丰度往往与养殖池塘水质、底泥的恶化相关。当环境中生物多样性失去平衡时,随SRB活跃度提升,其产生的硫化氢将加剧水体和底泥的恶化并造成大量的渔业经济损失[3]。
SRB在底泥环境中的定殖、硫酸盐还原代谢与其生物被膜形成直接相关[4,5]。细菌生物被膜广泛存在于各种物质表面,是单个或复合微生物群体形成的聚集物,由细菌细胞分泌多糖、蛋白质、核酸等物质在胞外聚合并将细胞自身包裹其中而形成[6]。现代研究发现,细菌生物被膜的形成与驱散主要受群体感应(Quorum sensing,QS)系统以及一系列体内调控网络控制[7]。QS系统通常指细菌在生长过程中释放自体诱导物(Autoinducer,AI),并通过受体蛋白感受胞外AI分子浓度,调控体内特定基因表达进而调整自身状态[8]。目前已知的自体诱导物主要包括高丝氨酸内酯(N-acyl-L-homoserine lactones,AHLs)、呋喃酮酰硼酸二酯(Furanosyl borate diester,AI-2)等[9]。AHLs信号分子的研究较为深入,其合成由luxI同源基因负责,感受信号并调控下游基因的受体为LuxR家族蛋白。LuxR家族蛋白一般由200~260个氨基酸构成,序列中包含氨基端的信号分子结合域(Autoinducer binding domains)和羧基端的DNA结合结构域(Helix-Turn-Helix)[10]。同时在一些细菌中也发现存在一类LuxR“solos”蛋白,该类蛋白没有配套的信号分子合成基因,但与其他LuxR蛋白具有相同的保守结构域以及感受信号分子、调控基因的功能,在细菌间、宿主和细菌间的交流过程中也起到重要作用[11]。
SRB生物被膜在底泥环境变化[4]、水体重金属微生物修复[12]以及微生物介导的金属表面锈蚀[13]等领域均有重要研究价值,但其具体的调控机制尚不清楚。近年来通过基因组数据挖掘,在部分脱硫弧菌中预测出潜在的信号合成及受体蛋白基因同源物,如在D.hydrothermalis、D.salexigens和Desulfotaleapsychrophila中发现信号分子合成酶同源物编码基因(luxS),但与大肠杆菌LuxS蛋白的序列一致性较低,为33%~34%[14],这类基因的具体功能还有待进一步验证。本研究前期工作发现SRB模式菌株D.vulgarisHildenborough(DvH)[15]的生物被膜通过自身胞外糖基水解酶DisH控制[16],随后通过对DvH菌株生物被膜时期及浮游生活时期的转录组比较分析及试验验证,发现调控蛋白DVU2956负调控生物被膜形成及硫化氢产生[17],并在上述转录组数据分析中发现类LuxR家族蛋白基因在生物被膜时期有上调。因此,本研究通过生物信息学分析方法对DvH菌株基因组中预测的3个类LuxR家族蛋白的理化性质、二级/三级结构、信号肽及跨膜结构、磷酸化位点、保守功能结构域和系统发育进行分析和预测,为后续研究SRB的QS系统及调控生物被膜形成等的分子机制奠定基础,也为群体感应猝灭剂等SRB控制剂的研发提供新的思路。
在KEGG基因数据库中依据基因编号查找获得 基 因citB1(dvu2577)、citB2(dvu2675)和citB3(dvua0137)的核苷酸及氨基酸编码序列,以及分别在美国国家生物技术信息中心(NCBI)蛋白质序列数据库中的注册编号:AAS97049(CitB1)、AAS97147(CitB2)和AAS94474(CitB3)。通过文献查阅以及利用Blastp程序在NCBI蛋白质数据库进行序列比对(氨基酸一致性超过70%),选择了17个来自不同种属菌株的典型LuxR家族蛋白作为参考:脱硫弧菌属Desulfovibriodesulfuricans(登录号ACL48718)、Desulfovibrioalaskensis(登录号MBL3582181.1)、Desulfovibriooxamicus(登录号MBG3876225.1)、Desulfovibriosp.XJ01(登录号NHZ46953.1)、Pseudodesulfovibriomercurii(登录号EGB16317.1)和Solidesulfovibrio alcoholivorans(登录号WP_029460621.1);放线菌属Streptomycescoelicolor(登录号CAA69209.1)、Streptomycespeucetius(登 录 号AAD15247.1)、Streptomyces pristinaespiralis(登 录 号CBW45649.1)、Streptomyces virginiae(登录号BAF50712.1)和Streptomycesvinaceus(登录号AAP92509.1);假单胞菌属Pseudomonas aeruginosa(登录号P25084.1)和Pseudomonasfluorescens(登录号EJZ57917.1);大肠杆菌Escherichiacoli(登录号P07026.2)以及麦氏交替单胞菌Alteromonasmacleodii(登录号VTO40702.1)、哈维氏弧菌Vibrioharveyi(登录号AAN86705.2)和根瘤菌Sinorhizobiummeliloti(登录号AFP89744.1)。
利 用ProtParam(https://web.expasy.org/protparam/)和ProtScale(https://web.expasy.org/protscale/)在线工具分析蛋白质CitB1、CitB2和CitB3的理化性质和亲疏水性[18]。利用NetSurfPv.3.0[19](https://services.healthtech.dtu.dk/service.php?NetSurfP-3.0)和SWISS-MODEL[20](https://swissmodel.expasy.org/interactive)预测CitB1、CitB2和CitB3蛋白的二、三级结构。利用SignalP 6.0[21](https://services.healthtech.dtu.dk/service.php?SignalP-6.0)和TMHMM-2.0[22](https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)分析CitB1、CitB2和CitB3蛋白的信号肽跨膜区和可能的跨膜结构。利用NetPhosBac 1.0 server[23](https://services.healthtech.dtu.dk/service.php?NetPhosBac-1.0)分析蛋白质磷酸化位点。残基得分介于0~1,当得分高于0.5时,残基被预测为磷酸化位点。利用在线工具Clustal Omega[24](https://www.ebi.ac.uk/Tools/msa/clustalo/)进 行CitB1、CitB2和CitB3蛋白的氨基酸序列同源性比对分析。结合上述其他同源蛋白,利用Trimal v.1.2[25](http://phylemon2.bioinfo.cipf.es/)对齐序列后,使用Mega-X[26]软件进行系统发育分析。
利用ProtParam工具分析citB1、citB2和citB3基因编码蛋白质的基本性质,结果表明,CitB1基因包含一个全长651 bp的完整阅读框,编码216个氨基酸,分子式为C1054H1758N296O315S6,分子质量为23 809.71 u,理论等电点为6.40,为弱酸性蛋白,负电荷残基总数(Asp+Glu)为33,正电荷残基总数(Arg+Lys)为31,不稳定指数(Instability index II)为35.95,归类为稳定蛋白。CitB1蛋白中氨基酸含量最高的为亮氨酸(Leu),占比13.0%,其次为丙氨酸(Ala),占比10.6%(图1)。
CitB2基因全长684 bp,编码227个氨基酸,分子式为C1071H1754N326O310S9,分子质量为24 446.25 u,理论等电点为7.01,为中性蛋白,负电荷残基总数(Asp+Glu)为31,正电荷残基总数(Arg+Lys)为31,不稳定指数(Instability index II)为36.42,归类为稳定蛋白。CitB2蛋白中氨基酸含量最高的为亮氨酸(Leu),占比14.1%,其次为丙氨酸(Ala),占比为11.5%(图1)。
CitB3基因全长648 bp,编码215个氨基酸,分子式为C1015H1642N294O317S7,分子质量为23 260.40 u,理论等电点为4.97,为弱酸性蛋白,负电荷残基总数(Asp+Glu)为32,正电荷残基总数(Arg+Lys)为23,不稳定指数(Instability index II)为29.14,归类为稳定蛋白。CitB3蛋白中氨基酸含量最高的为亮氨酸(Leu),占比14.9%,其次为丙氨酸(Ala),占比10.7%(图1)。
图1 基因citB1、citB2和citB3编码蛋白质的氨基酸组成
根据ProtScale工具分析citB1、citB2和citB3基因编码蛋白质的亲疏水性,结果表明,CitB1蛋白最小值为-2.789,最大值为1.967;CitB2蛋白最小值为-2.433,最大值为2.100;CitB3蛋白最小值为-1.900,最大值为2.033;均为亲水蛋白(图2)。
图2 基因citB1、citB2和citB3编码蛋白质的亲水/疏水分析
利用NetSurfP 3.0分别预测了基因citB1、citB2和citB3编码蛋白质的二级结构。CitB1蛋白中51.85%的氨基酸形成α螺旋,20.37%为无规则卷曲,5.09%为β片层;CitB2蛋白中47.13%为α螺旋,26.87%为无规则卷曲,4.41%为β片层;CitB3蛋白中46.51%为α螺旋,26.98%为无规则卷曲,6.05%为β片层(图3)。
图3 基因citB1、citB2和citB3编码蛋白质的二级结构预测
利用SWISS-MODEL分别预测了基因citB1、citB2和citB3编码蛋白质的三级结构。CitB1蛋白三维建模最高全局模型质量估计值(GMQE)为0.72,表明结构预测较为可靠(>0.7)。参考蛋白为调控蛋白VarR(SWISS-MODEL数据库编号5hev.1.A),两者氨基酸序列一致性为30.00%。CitB2蛋白三维建模最高GMQE值为0.67,表明结构预测可靠性较低。参考蛋白为双组份转录调控蛋白DevR(SWISSMODEL数据库编号3c3w.1.A),两者氨基酸序列一致性为29.67%。CitB3蛋白三维建模最高GMQE值为0.64,表明结构预测可靠性较低。参考蛋白同样为双组份转录调控蛋白DevR,两者氨基酸序列一致性为30.85%。如图4所示,3个蛋白主要结构为α螺旋,与二级结构预测结果一致。
图4 基因citB1、citB2和citB3编码蛋白质的三级结构预测
利用SignalP-6.0和TMHMM工具分别进行基因citB1、citB2和citB3编码蛋白质的信号肽跨膜区及跨膜结构分析,结果表明,3个蛋白均不具有信号肽以及跨膜结构(图5和图6)。
图5 基因citB1、citB2和citB3编码蛋白质的信号肽跨膜区分析
图6 基因citB1、citB2和citB3编码蛋白质的跨膜结构域分析
由图7可见,CitB1蛋白磷酸化位点有3个,其中,丝氨酸磷酸化位点2个,包括第35位氨基酸(得分:0.506)和第89位氨基酸(得分:0.650);苏氨酸磷酸化位点为第213位氨基酸(得分:0.604)。CitB2蛋白磷酸化位点有6个,其中,丝氨酸磷酸化位点5个,包括第31位氨基酸(得分:0.763)、第38位氨基酸(得分:0.570)、第119位氨基酸(得分:0.552)、第130位氨基酸(得分:0.514)和第202位氨基酸(得分:0.698);苏氨酸磷酸化位点为第150位氨基酸(得分:0.533)。CitB3蛋白磷酸化位点有8个,其中,丝氨酸磷酸化位点7个,包括第117位氨基酸(得分:0.722)、第134位氨基酸(得分:0.669)、第140位氨基酸(得分:0.522)、第157位氨基酸(得分:0.587)、第165位氨基酸(得分:0.634)、第172位氨基酸(得分:0.512)和第201位氨基酸(得分:0.660);苏氨酸磷酸化位点为第205位氨基酸(得分:0.541)。
图7 基因citB1、citB2和citB3编码蛋白质的磷酸化位点分析
依据KEGG数据库中对CitB1、CitB2和CitB3蛋白保守结构域的分析发现,3个蛋白均包含2个保守结构域:响应调控子信号接收结构域(Response regulator receiver domain)和LuxR家族DNA结合调控结构域(Bacterial regulatory proteins,LuxR family)。其中,信号接收结构域分别在CitB1、CitB2和CitB3蛋白的5~116位、7~117位、16~123位;DNA结合调控结构域分别在3个蛋白的152~207位、155~207位和156~204位(图8)。上述结果表明,CitB1、CitB2和CitB3均为潜在的双组份系统应答调控蛋白。通常双组份调控系统的调控蛋白基因上下游存在对应的组氨酸蛋白激酶基因,但本研究中3种蛋白基因上下游均没有发现该类功能基因,因此它们可能是一种“solos”型的应答调控蛋白。
通过氨基酸序列同源性比对分析发现,CitB1、CitB2和CitB3蛋白之间氨基酸一致性分别为37.79%(CitB1和CitB2)、28.99%(CitB1和CitB3)、31.48%(CitB2和CitB3)。氨基端的信号接收结构域变异性较大,保守或类似氨基酸残基占比43.75%(49/112),而在羧基端的DNA结合调控结构域较保守,保守或类似氨基酸残基占比60.71%(34/56)(图8)。非典型应答调控蛋白的信号传导往往与不同的小分子信号有关,氨基端的变异性较大可能与接收不同信号分子有关。
图8 基因citB1、citB2和citB3编码蛋白质的聚类分析
为了分析CitB1、CitB2和CitB3蛋白与其他物种中同源蛋白的亲缘关系,本研究选择来自不同种属菌株的典型LuxR家族蛋白进行系统发育分析。系统发育树以最大似然法(Maximum likelihood)构建,检验方法为步长检验方法(Bootstrap method),检验次数1 000次。分析发现,与大肠杆菌、假单胞菌等来源的LuxR家族蛋白较为保守、亲缘关系较近不同,SRB来源的蛋白与其他细菌、放线菌亲缘关系较远,这可能与其不同的氨基端保守结构域有关。CitB1蛋白与其他脱硫弧菌亲缘关系最近,CitB3蛋白介于脱硫弧菌与类似菌(如Solidesulfovibrio)之间,CitB2蛋白则相对于其他脱硫弧菌同族蛋白亲缘关系较远(图9)。该结果暗示在模式菌株DvH中,CitB1和CitB3蛋白发挥的信号接收方式、下游基因调控功能在SRB群体中具有普遍性,CitB2蛋白的信号接收方式及基因调控可能具有特异性。
图9 基因citB1、citB2和citB3编码蛋白质的系统发育分析
由于SRB在硫元素循环中的重要作用,以及在人类社会活动中的重大影响,该类细菌的QS系统一直是厌氧细菌基础研究和应用领域的热门话题。本研究利用生物信息学分析方法,对SRB模式菌株DvH基因组中的3个类LuxR家族调控蛋白进行了功能、结构的预测和分析,发现尽管羧基端含有保守的DNA结合结构域,但CitB1、CitB2和CitB3蛋白氨基端的信号接收保守结构域与保守的LuxR家族调控蛋白的自体诱导物结合结构域显著不同,暗示它们接受的信号分子可能不是已知的AHLs等自体诱导物信号分子。
参考革兰氏阴性细菌QS系统的AHL信号作用模式,前人通过构建同为革兰氏阴性菌的脱硫弧菌菌株H2.3jLac的基因组fosmid文库,在体外鉴定出其可能产生包括C6-AHL、oxo-C6-AHL、C8-AHL、C10-AHL和C12-AHL等AHL信号分子,但合成酶基因以及受体蛋白仍不清楚[27]。另有研究通过体外添加C8-AHL、C10-AHL和C12-AHL等信号分子及相关抑制剂处理,发现AHLs对DvH菌株细胞生长的影响主要体现于ATP的活跃程度,进一步转录组学分析没有发现可能的QS调控系统[13]。此外,有研究发现,DvH菌株的一个2-异丙基苹果酸合酶基因在体外融合QS信号激活型绿色荧光蛋白共表达时能激活荧光,因此推断该合成酶产物可与LuxR类QS信号感应受体结合[28]。尽管该酶合成的产物未知,结合本研究结果,该基因产物可能为上述3个类LuxR家族调控蛋白CitB1、CitB2和CitB3接收的上游信号分子之一,暗示SRB可能具有独特的QS信号分子通讯系统。这可能与SRB处于严格厌氧的自然环境,以硫元素代替氧元素进行生命活动有关。
在应用控制方面,目前多使用广谱抗生素、杀菌剂,并联合投加硝酸盐及氧化剂等手段减缓SRB生物被膜及硫化氢等产物对地下金属输水、输油管道的锈蚀[29]、油藏的酸化[30],以及去除引发河道底泥黑臭的硫化氢来源[31]。同时由于硫化氢能与重金属离子形成沉淀,SRB的人工利用也是重金属废水生物修复技术的热点研究话题[32]。大量抗生素、杀菌剂的使用往往伴随巨大的环境风险,因此研发绿色环保的SRB控制技术具有广阔的应用前景。对SRB的QS系统的深入研究,尤其是对其胞外通讯信号分子以及受体调控蛋白的作用机制研究将有利于特异性的控制剂创制及相关技术的研发。