非洲猪瘟病毒p10蛋白和p49蛋白的生物信息学分析及表位预测

2024-09-27 00:00:00孙卓雅王梦翔宋金星秦晓东孙俊如周蕾吴亚楠张改平
江苏农业科学 2024年15期

摘要:运用多种生物信息技术对非洲猪瘟病毒(ASFV)Georgia 2007/1株p10蛋白和p49蛋白的理化性质、二级及三级空间结构、抗原性、抗原决定簇进行初步分析,并预测其B、T淋巴细胞优势表位。结果表明,p10是亲水性蛋白,含有2个抗原决定簇,该蛋白α-螺旋、β-转角、无规则卷曲和延伸链的比例为32.05%、11.54%、52.56%和3.85%;p49同样是亲水性蛋白,含有17个抗原决定簇,其α-螺旋、β-转角、无规则卷曲和延伸链的比例依次为29.91%、7.53%、55.94%和6.62%。基于以上分析,p10不适合用于ASF疫苗制备的候选蛋白;而p49作为亲水性衣壳蛋白,具有一定免疫原性,有望成为疫苗研制的备选蛋白,为ASFV蛋白研究和疫苗研发提供一定参考。

关键词:非洲猪瘟;生物信息学;表位预测

中图分类号:S855.3 文献标志码:A

文章编号:1002-1302(2024)15-0195-08

收稿日期:2023-09-05

基金项目:国家自然科学基金(编号:32002292),河南省重大科技专项(编号:221100110600)。

作者简介:孙卓雅(1999—),女,硕士研究生,研究方向为分子免疫和亚单位疫苗等,E-mail:792474123@qq.com;共同第一作者:王梦翔(1998—),男,硕士研究生,研究方向为亚单位疫苗和蛋白质谱分析等,E-mail:1834768483@qq.com。

通信作者:吴亚楠,博士,副教授,研究方向为动物免疫分子的蛋白质结构及功能解析,E-mail:wlyananjiayou@yeah.net;张改平,中国工程院院士,博士,教授,研究方向为动物病毒分子致病机制和食品安全检测,E-mail:zhanggaip@126.com。

非洲猪瘟(African swine fever,ASF)是由非洲猪瘟病毒(African swine fever virus,ASFV)感染猪而引起的一种急性接触性、广泛出血性、烈性传染病,各年龄段的猪均易感。ASF的临诊症状很难和猪瘟区别,根据毒力和感染途径不同ASF可表现为最急性型(强毒株)、急性型(中等毒力毒株)、亚急性型和慢性型(弱毒株);死亡率分别为100%、90%~100%、30%~70%和<30%。有研究测算,2018年8月至2019年7月中国非洲猪瘟疫情总经济损失约占2019年中国GDP的0.78%,ASF疫情不仅直接冲击养猪业,且通过产业关联,几乎波及到所有经济部门[1],对我国经济危害极大。

ASFV基因组大小为170~190 kb,编码超过200种蛋白质,其中,超过50种为结构蛋白,其中,p10蛋白是由K78R基因编码的一个亲核结构蛋白,位于ASFV最内侧的拟核内,具有核定位信号。已有研究表明,p10能与单链或双链DNA结合,推测其可能在含DNA类核的组装中发挥作用。同时,有体外试验证明当ASFV感染细胞时,p10在宿主细胞核中聚集,即p10具有穿过核孔的能力[2]。p49蛋白是由B438L编码的衣壳蛋白,在感染后晚期表达,是病毒粒子感染必需结构蛋白,当缺乏p49时病毒所形成的病毒颗粒虽具有管状结构,但二十面体对称性丧失,通过免疫电镜对完整的病毒体或病毒颗粒进行观察,发现p49位于衣壳顶点附近,表明该蛋白在构建或稳定病毒颗粒二十面体顶点过程中起重要作用[3]。鉴于上述重要性,有必要对此2种蛋白的结构和功能进行解析,但目前国内外对ASFV蛋白和抗原表位的研究主要集中在p30[4]、p72[5]、p54[6]、CD2v[7]、K205R[8]等,对p10蛋白和p49蛋白的相关研究较少。本研究选择了2种研究相对较少但功能很重要的结构蛋白p10和p49作为分析对象,通过氨基酸序列比对发现,由图1、图2可知,p10和p49在不同毒株中均十分保守,按照我国流行病学中心的相关监测,目前国内流行的非洲猪瘟病毒属基因Ⅱ型,所以选择了同源性约为99.95% Georgia 2007/1株(GenBank No.MK128995)[9]。传统抗原表位筛选工作量大、成本费用高,生物信息学技术可很好地避免这些问题,并已被广泛使用。本研究利用生物信息学技术对p10和p49蛋白进行了相关分析并预测了优势表位,以期为此2种蛋白结构与功能的深入研究、ASFV相关诊断及疫苗产品的研制奠定基础。

1 材料与方法

1.1 材料

从NCBI蛋白质数据库(https://www.ncbi.nlm.nih.gov/)中检索Georgia/2007株p10和p49蛋白的氨基酸序列。

1.2 方法

1.2.1 理化性质分析

ProtParam tool(https://web.expasy.org/protparam/)用于蛋白质的物理化学性质分析,包括:氨基酸数量、氨基酸组成、原子组成、分子式、分子量、理论等电点、消光系数、估计半衰期、不稳定性指数、脂肪族指数和亲水性均值等。蛋白质的不稳定性指数间接表明了蛋白质的稳定性,如果计算得到的蛋白质不稳定指数<40,则认为是稳定蛋白,>40则认为是不稳定蛋白。

使用Expasy(https://web.expasy.org/protscale/)中的protscale工具预测p10和p49的亲水性[10]。

1.2.2 二级结构预测

使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa%20_sopma.html)[11]和DNASTAR软件预测p10和p49蛋白的二级结构[12]。

1.2.3 三级结构预测

使用Phyre 2服务器(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)[13]预测p10和p49蛋白的三级结构,该服务器通过使用多模板建模和简化的从头折叠模拟生成蛋白质序列的全长3D模型。

1.2.4 抗原性分析

为分析p10和p49蛋白的潜在抗原性,本试验使用在线预测服务器VaxiJen v2.0(http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html)来预测蛋白的抗原性[14]。根据服务器应用参数的标识,对抗原保护性预测结果≥0.4为可能潜在的保护性抗原(病毒模式的阈值为0.4)。

1.2.5 抗原决定簇预测

使用Predicting antigenic peptides(http://imed.med.ucm.es/Tools/antigenic.pl)预测p10和p49蛋白潜在的抗原决定簇[13]。

1.2.6 优势B细胞线性表位的预测

利用ABCpred(https://webs.iiitd.edu.in/raghava/abcpred/ABC_submission.html)服务器来预测p10和p49蛋白的B细胞线性表位。ABCpred服务器基于人工神经网络(ANN)[15]进行预测,本研究将2种蛋白的氨基酸序列提交到服务器,从得分>0.5的多肽序列中,挑选出具有免疫原性的候选表位。

1.2.7 细胞毒性T淋巴细胞(CTL)表位的预测 CTL表位需要经抗原呈递细胞处理,与MHC Ⅰ类

分子结合后才能递呈给T细胞进行识别[16]。使用NetMHCpan4.1(https://services.healthtech.dtu.dk/services/NetMHCpan-4.1/)服务器预测多肽与MHCⅠ类分子之间的结合能力。根据综合评分和蛋白质二级结构,筛选出p10和p49蛋白中可能结合特定MHC-Ⅰ类分子的多肽序列[17]。

1.2.8 辅助性T淋巴细胞(HTL)表位的预测

使用NetMHCpan 4.1服务器预测能与MHC-Ⅱ类分子结合的多肽表位,根据抗原表位的%Rank_EL分数及干扰素-γ(IFN-γ)的释放来选择多肽序列,其中%Rank_EL预测结合评分的等级[18]。

2 结果与分析

2.1 理化性质分析

由ProtParam软件分析结果(表1)可知,p10共有78个氨基酸,分子量为8.43 ku,理论等电点为10.98,共有3个带负电的残基,18个带正电的残基。蛋白由1 195个原子组成,化学成分为 C354H608N116O113S4。计算的不稳定系数为53.66,表明该蛋白为不稳定蛋白。体外半衰期预测为30 h,在体内、酵母和大肠杆菌的半衰期预测分别大于 20 h 和 10 h。蛋白的脂肪指数为43.85,蛋白结构的亲水性平均系数为-1.086。由Expasy中protscale工具预测结果(图3)可知,该蛋白具有亲水性。

由表2可知,p49蛋白共有438个氨基酸,分子量为49.4 ku,理论等电点为9.22,共有39个带负电残基,51个带正电残基。蛋白由6 889个原子组成,化学成分为C2 193H3 402N620O663S11。计算的不稳定系数为54.25,表明该蛋白为不稳定蛋白。体外半衰期预测为30 h,在体内、酵母和大肠杆菌的半衰期预测分别大于20 h和10 h。蛋白的脂肪指数为69.47,蛋白结构的亲水性平均系数为-0.749。由Expasy中protscale工具预测结果(图4)可知,该结构具有亲水性。

2.2 p10和p49蛋白质二级结构预测

由图5可知,SOPMA分析蛋白质二级结构,p10蛋白中25个氨基酸组成α-螺旋,占总氨基酸的32.05%,3个氨基酸构成延长链,占总氨基酸的3.85%,9个氨基酸构成β-转角,占总氨基酸的

11.54%,41个氨基酸构成无规则卷曲,占总氨基酸的52.56%。由图6可知,p49蛋白中131个氨基酸组成α-螺旋,占总氨基酸的29.91%,29个氨基酸构成延长链,占总氨基酸的6.62%,33个氨基酸构成β-转角,占总氨基酸的7.53%,245个氨基酸构成无规则卷曲,占总氨基酸的55.94%。

DNASTAR分析使用了Gramier-Robson、Chou-Fasman、Kyte-Doolittle、Eisenberg、Karplus-Schulz、Jameson-wolf和Emini方法预测结果。由图7可知,p10蛋白的β-折叠分布在第3~9、16~19、20~26、27~32、33~37、49~52、55~58、60~62、68~74位氨基酸片段,无规则卷曲在第5~37、52~55、60~76位氨基酸片段。由图8可知,p49蛋白的β-折叠分布在第6~18、32~42、72~78、163~172、179~194、235~250、342~352、390~405、418~427位氨基酸片段,无规则卷曲在第15~30、51~63、87~100、128~133、138~173、179~203、240~260、267~280、320~326、356~367、373~382、387~410和415~427位氨基酸片段。

2.3 p10和p49蛋白三级结构预测

通过Phyre 2预测,由图9、图10可知p10和p49的三级结构。

2.4 p10和p49蛋白的抗原性分析

VaxiJenV预测p10蛋白的抗原指数为0.323 9,阈值为0.4,说明p10蛋白抗原性不强;p49的抗原指数为0.452 4,指示p49蛋白有一定的抗原性。

2.5 p10和p49抗原决定簇预测

Predicting antigenic peptides预测结果显示,p10蛋白的平均抗原倾向是0.972 6,具有较好的抗原性,具有2个抗原决定簇,所在区域分别位于第 44~50、52~61位氨基酸;p49蛋白的平均抗原倾向是1.019 7,具有良好的抗原性,具有17个抗原决定簇,分别位于第4~12、45~51、62~68、90~96、121~127、132~139、143~156、174~183、205~230、238~246、249~255、258~271、287~331、338~348、350~359、407~414、426~434位氨基酸。

2.6 p10和p49蛋白优势B淋巴细胞表位预测

线性B细胞表位的预测是基于ABCpred服务器,此服务器鉴定的B细胞表位预测值范围为 0.51~1.00 多肽序列的分值越高 其是B细胞抗

原决定簇的可能性越大,预测结果显示,p10蛋白B细胞抗原表位共有6个,分别为第2~19、52~67、38~53、46~61、29~44、20~35、61~76、11~26位氨基酸;p49蛋白有26个,分别为第41~56、273~288、19~34、415~430、397~412、355~350、231~246、252~267、206~221位氨基酸等。根据抗原决定簇位点的预测结果和二级结构β-转角和无规卷曲为参考,由表3可知优势B淋巴细胞表位。

2.7 p10和p49蛋白优势细胞毒性T淋巴细胞(CTL)表位的预测

T细胞表位是由NetMHCpan 4.1服务器进行预测,结果综合评分及抗原决定簇位点预测结果和蛋白二级结构的β-螺旋和无规卷曲,筛选出优势CTL细胞表位。由表4可知,共得到p10有3条优势表位,p49有5条优势表位。

2.8 p10和p49蛋白的辅助性T淋巴细胞(HTL)表位的预测

HTL(13位氨基酸)表位则是先由NetMHCpan 4.1服务器预测,初步得到序列,然后将这些序列输入至IFNepitope服务器中,最终选出IFN-γ阳性诱导的序列。由表5可知,共得到3条p10优势表位,6条p49优势表位。

3 讨论与结论

自2018年8月我国首次出现ASF以来,疫情快速蔓延至内陆各省份。鉴于我国野猪和软蜱的分布广泛,更易形成ASF的自然疫源地[19];加之目前我国的生猪养殖方式多样化、养殖密度高、从业人员生物安全意识淡薄,导致我国ASF防控形势十分严峻[20]。由于ASFV的复杂性,且目前对于ASFV与宿主相互作用的研究还存在一定局限性,所以疫苗的研发仍处于初始阶段。当前,防控和根除ASF的方法仅限于早期诊断、检疫和消灭疫点疫区内易感动物,因此对高效、安全且可广泛使用的疫苗需求非常急迫。所以深入了解ASFV的生命周期,预测各个蛋白的结构,将会增加疫苗开发的成功率,有助于有效预防ASFV的感染。本研究通过在线工具预测蛋白质结构且筛选出优势B细胞抗原表位和优势T细胞抗原表位,可用作靶向药物、表位疫苗研制的筛选对象[21]。有学者运用生物信息学方法,设计出了一种可治疗牛结节疹的亚单位疫苗[22];俱雄等通过生物信息学软件对大肠杆菌外膜蛋白OmpC进行结构和表位分析,重组拼接获得OmpC蛋白表位多肽[23],这些研究均表明生物信息学目前已广泛运用于各种表位疫苗的设计。

本研究运用多种生物信息学方法,对Georgia 2007/1株p10蛋白和p49蛋白的理化性质、二级结构、三级结构、抗原性、抗原表位进行预测。预测发现,p10蛋白为亲水不稳定蛋白,含有2个抗原决定簇,预测出的抗原指数为0.323 9,阈值为0.4,说明p10的抗原性不强,氨基酸中占比重较多的是无规卷曲和α-螺旋;p49蛋白的预测结果为亲水不稳定蛋白,含有17个抗原决定簇,预测出的抗原指数为0.452 4,说明p49蛋白具有一定的抗原性,二级结构中占总氨基酸比重较多的是β-转角和无规则卷曲。β-转角和无规则卷曲能够突出于蛋白的表面,表面可及性较强,容易形成抗原表位[11],以上说明p49蛋白具有免疫原性,且极有可能存在潜在优势抗原表位,可以作为ASFV疫苗研发的候选蛋白。

参考文献:

[1]You S B,Liu T Y,Zhang M,et al. African swine fever outbreaks in China led to gross domestic product and economic losses[J]. Nature Food,2021,2:802-808.

[2]Nunes-Correia I,Rodríguez J M,Eulálio A,et al. African swine fever virus p10 protein exhibits nuclear import capacity and accumulates in the nucleus during viral infection[J]. Veterinary Microbiology,2008,130(1/2):47-59.

[3]Wang N,Zhao D M,Wang J L,et al. Architecture of African swine fever virus and implications for viral assembly[J]. Science,2019,366(6465):640-644.

[4]周改静,罗俊聪,石正旺,等. 非洲猪瘟病毒p30蛋白单克隆抗体的制备及阻断ELISA抗体检测方法的建立[J]. 畜牧兽医学报,2022,53(12):4337-4345.

[5]Duan X L,Liu Y N,Chen Z Y,et al. Identification of monoclonal antibody targeting epitope on p72 trimeric spike of African swine fever virus[J]. Virus Genes,2023,59(4):582-590.

[6]Imdhiyas M,Sen S,Barman N,et al. Computational analysis of immunogenic epitopes in the p30 and p54 proteins of African swine fever virus[J]. Journal of Biomolecular Structure & Dynamics,2023,41(15):7480-7489.

[7]Ren D N,Ding P Y,Liu S Y,et al. Development and characterization of recombinant ASFV CD2v protein nanoparticle-induced monoclonal antibody[J]. International Journal of Biological Macromolecules,2022,209(Pt A):533-541.

[8]Wang Q,Zhou L Y,Wang J,et al. African swine fever virus K205R induces ER stress and consequently activates autophagy and the NF-κB signaling pathway[J]. Viruses,2022,14(2):394.

[9]Chapman D A G,Darby A C,Da Silva M,et al. Genomic analysis of highly virulent Georgia 2007/1 isolate of African swine fever virus[J]. Emerging Infectious Diseases,2011,17(4):599-605.

[10]黄晓慧,王 炜,王 倩,等. 生殖支原体P110蛋白的生物信息学分析[J]. 中国病原生物学杂志,2021,16(6):639-643,650.

[11]高 瞻,邵军军,常艳燕,等. 非洲猪瘟病毒p72蛋白抗原表位预测分析及多表位疫苗的构建[J]. 中国兽医杂志,2020,56(1):13-17,142-144.

[12]王晓哲,肖正泮,韦双双,等. 利用DNAStar软件预测热带无爪螨主要致敏原Blot 5的抗原表位[J]. 热带生物学报,2017,8(1):107-112.

[13]何川川,童剑军,米丽开姆·托合提尼亚孜,等. 山羊痘病毒069蛋白的表达与结构分析[J]. 中国兽医学报,2020,40(5):907-915.

[14]Almofti Y A,Abd-Elrahman K A,Eltilib E E M.Vaccinomic approach for novel multi epitopes vaccine against severe acute respiratory syndrome coronavirus-2 (SARS-CoV-2)[J]. BMC Immunology,2021,22(1):22.

[15]Saha S,Raghava G P S. Prediction of continuous B-cell epitopes in an antigen using recurrent neural network[J]. Proteins,2006,65(1):40-48.

[16]Skwarczynski M,Toth I. Recent advances in peptide-based subunit nanovaccines[J]. Nanomedicine,2014,9(17):2657-2669.

[17]Reynisson B,Alvarez B,Paul S,et al. NetMHCpan-4.1 and NetMHCIIpan-4.0:improved predictions of MHC antigen presentation by concurrent motif deconvolution and integration of MS MHC eluted ligand data[J]. Nucleic Acids Research,2020,48(W1):W449-W454.

[18]Dhanda S K,Vir P,Raghava G P S. Designing of interferon-gamma inducing MHC class-Ⅱ binders[J]. Biology Direct,2013,8:30.

[19]汪葆玥,刘玉良,马 静,等. 非洲猪瘟:传染源和传播途径研究进展与分析[J]. 中国动物传染病学报,2020,28(5):103-110.

[20]王 凯,范志新,田昊伦,等. 非洲猪瘟的流行概况及防控策略[J]. 中国兽医学报,2019,39(5):1027-1034.

[21]曹乾大,戴碧红,曹雪莲,等. 非洲猪瘟病毒Pig/HLJ/2018株CP2475L编码蛋白pp220的生物信息学分析[J]. 猪业科学,2021,38(7):100-105.

[22]Kar P P,Araveti P B,Kuriakose A,et al. Design of a multi-epitope protein as a subunit vaccine against lumpy skin disease using an immunoinformatics approach[J]. Scientific Reports,2022,12:19411.

[23]俱 雄,党亚锋,刘 祥,等. 大肠杆菌外膜蛋白OmpC的生物信息学分析及表位多肽疫苗的重组预测[J]. 河南农业大学学报,2017,51(1):94-100.