王占军, 金 伦, 徐忠东, 欧祖兰
(合肥师范学院 生命科学学院, 合肥 210061)
麻风树(JatrophacurcasL.)为原产于中美洲的多年生落叶灌木或小乔木,后经葡萄牙海员传播至非洲和亚洲等国家[1-2]。它具有易于种植、抗寒、耐干旱、生长快和适应广泛气候条件等优点[3-5]。以往,麻风树常被用于制药、生产肥料和防治水土流失等领域[6];近年来,研究人员发现,麻风树的种子含有较高(30%~40%)的与食用油中相似的脂肪酸成分,以及与化石燃料相似的油脂成分[7],其油脂成分中含有比例高达80%的亚麻酸和油酸[8]。因此,科研工作者们将麻风树视为生产生物柴油的模式植物[9],并已在中国、印度和非洲等国家大规模种植[10]。有关麻风树的育种目标,Maghuly等[2]提出是获得高油脂产量的优良种质资源,选择和繁殖大量优良种质资源也是完成驯化和提高能够适应不利气候条件下麻风树产量的首要目标。然而,麻风树是一种半野生型植物,Achten等[11]估计至少需要15年才能完成其从传统育种到驯化的目标,Ye等[12]发现如此长的研究周期能够通过转基因技术来缩短。因此,发现和验证出能够调控麻风树油脂产量的功能基因,再利用转基因技术培育出具有高油脂产量的麻风树优良株系,显得尤为重要。
LEC1(LEAFYCOTYLEDON1)是编码CCAAT-box结合转录因子HAP3(Heme-activated protein 3)亚单位的基因,在植物种子发育过程中起着重要的调控作用[13]。例如,lec1突变体呈现出胚胎发育异常且不耐干燥[14]、部分种子成熟特异基因表达缺失和种子贮藏蛋白的表达量降低等现象[15-16];而在拟南芥突变体lec1-1中异位过量表达拟南芥LEC1基因时,其T1代拟南芥种子中恢复了lec1突变体的胚胎发育异常和不耐干燥的表型[13,17],在T2代拟南芥种子中出现了贮藏蛋白积累的现象[13]。除此之外,Mu等[18]在拟南芥中过量表达拟南芥和甘蓝型油菜LCE1基因,揭示LEC1基因具有正向调控12个脂肪酸生物合成相关基因表达的功能,从而控制脂肪酸合成和脂质积累。Shen等[19]研究发现,过量表达玉米LEC1基因时提高了其种子的油脂产量(约高达48%),但同时降低了种子的萌发率,抑制了叶片的生长。在前期研究的基础上,Tan等[20]利用定向表达技术在甘蓝型油菜中表达其LEC1基因,提高了种子中油脂的含量。
本文选择功能已知的拟南芥LEC1基因为参考序列,利用生物信息学方法系统地分析麻风树LEC1基因,并将分析结果与拟南芥LEC1基因的生物信息学分析结果进行对比,同时解析麻风树LEC1基因的进化关系,旨在为将来麻风树LEC1基因的功能解析提供参考信息。
数据为源自于NCBI数据库(http://www.ncbi.nlm.nih.gov/)的麻风树LEC1基因(序列号:AEO22132.1)和拟南芥LEC1基因(序列号:NP_173616.2)的氨基酸序列。
运用Expasy数据库(http://www.expasy.org/tools)中的ProtParam分析编码蛋白的氨基酸组分,ProtScale工具分析其理化性质;采用SignalP 4.1 Server(http://www.cbs.dtu.dk /services/SignalP)进行信号肽预测;应用TMHMM(www.cbs.dtu.dk/services/TMHMM/)预测蛋白质跨膜特征;使用ProtComp(http://linux1.softberry.com/berry.phtml?topic=protcomppl&group=programs&subgroup=proloc)进行亚细胞定位;蛋白质二级的结构预测用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)完成;蛋白质三级建模用SWISS-MODEL完成;用ProtFun(http://www.cbs.dtu.dk/services/ProtFun/)来预测蛋白的功能分类;采用NCBI数据库中的CDD(Conserved Domain Database,http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析编码蛋白序列的功能结构域;使用Clustal X2.1实现氨基酸序列的多重比对分析;系统进化树用MEGA6.0[21]完成。
运用ProtParam和ProtScale分析麻风树和拟南芥LEC1蛋白,结果如表1所示。其中,麻风树LEC1蛋白由22种氨基酸组成,共计226个氨基酸残基,其中Ser和Gly含量最高,达8.8%,不含有Pyl和Sec;其中27个碱性氨基酸(Arg+Lys),29个酸性氨基酸(Asp+Glu),氨基酸序列的不稳定性系数为47.94(>40),说明该蛋白的稳定性较低;预测蛋白分子量为25.115 kDa,理论等电点(pI)为6.55,原子组成为C1075H1689N327O344S13,亲水性指数为-0.688,表明其为亲水性蛋白。比较麻风树LEC1蛋白与拟南芥LEC1蛋白的氨基酸组成,发现两种植物的LEC1蛋白的氨基酸含量最高的都是Ser和Gly,蛋白稳定性均较低,并且氨基酸的亲水性指数也相似,均为亲水性蛋白。
表1 麻风树和拟南芥LEC1蛋白组分和理化性质
表 2 麻风树和拟南芥LEC1蛋白亚细胞定位结果
使用SignalP 4.1预测麻风树和拟南芥LEC1蛋白的信号肽,结果表明两蛋白均不存在信号肽,据此推测它们都属于非分泌型蛋白。TMHMM分析揭示两种植物的LEC1蛋白都没有跨膜结构域。ProtComp进行亚细胞定位预测,表2结果显示麻风树LEC1蛋白和拟南芥LEC1蛋白亚细胞主要都分布在细胞核内。
表 3 麻风树与拟南芥LEC1蛋白二级结构的比较
由表3分析结果可知,麻风树LEC1蛋白的二级结构主要由无规则卷曲(占50.00%)、α螺旋(占39.38%)和β转角(占7.52%)组成,延伸链比例较小(占3.10%);拟南芥LEC1蛋白的二级结构主要是由无规则卷曲(占53.36%)、α螺旋(占27.73%)和延伸链(占13.45%)组成,β转角比例较小(占5.46%);结果表明,两种植物的LEC1蛋白在二级结构的主体结构相似,但是也存在一定差异。
将麻风树LEC1蛋白的氨基酸序列上传至PDB数据库(Protein Data Bank, http://www.rcsb.org/)查找同源序列,使用SWISS-MODEL进行蛋白质同源建模。通常相似性超过50%即可获得较精确结构模型,选择其中同源性最高的序列(PDB编号:1N1JA,同源性:63.44%)作为模板序列,同源建模结果如图1所示;利用Swiss-PdbViewer制作麻风树LEC1蛋白的Ramachandran图,其中φ(phi)表示图的横坐标,ψ(psi)为纵坐标,根据Ramachandran图结果检测蛋白建模的合理性。检测结果如图2所示,Ramachandran图中φ角和ψ角有91.9%处于的合理区域内,表明所模拟的蛋白三维结构是可信的。
图 1 麻风树LEC1蛋白三级结构模拟图
图 2 麻风树LEC1蛋白Ramachandran构象图
ProtFun功能预测分类结果如表4所示,麻风树LEC1蛋白具有生长因子、转录调控、荷尔蒙的概率比较高,分别为5.576、1.739和1.103;拟南芥LEC1蛋白含有生长因子、转录调控、转录的概率比较高,分别为9.395、1.936和1.503。据有关功能分析报道,作为编码CCAAT-box结合转录因子HAP3亚单位的基因,拟南芥LEC1具有调控种子发育过程中重要生长因子的功能[13];由表4结果可知,麻风树LEC1蛋白具有作为生长因子和转录调控的可能性较高,但是与拟南芥LEC1蛋白功能预测结果不同,麻风树LEC1中荷尔蒙的概率也比较高,推测麻风树LEC1基因的表达可能会受到激素的影响。
表 4 麻风树和拟南芥LEC1蛋白的功能预测
应用CDD在线软件分析麻风树与拟南芥LEC1蛋白的功能结构域,结果见图3,在麻风树与拟南芥LEC1蛋白存在高度保守的CBFD-NFYB-HMF结构域,该结构域是一个转录激活因子,它与含CCAAT-box的DNA 序列相结合,从而激活启动子的转录,据此推测麻风树LEC1基因也是转录因子,并且可能具有与拟南芥相似的功能。
运用NCBI中BLASTP比对分析麻风树LEC1蛋白的同源序列,筛选出结果中同源性较高的氨基酸序列,利用Clustal X2.1软件进行多重比对分析,基于Lotan[13]和Lee[22]等有关拟南芥和其他生物HAP3亚单位B结构域的研究结果,发现与图3功能结构域分析结果一致,17条同源性较高的植物LEC1蛋白的B结构域也很保守(见图4),具有3个α螺旋和2个环结构;其中,麻风树LEC1蛋白在第一个α螺旋结构中存在DNA结合序列(MPIANVI),第2个α螺旋结构中存在亚基间相互作用的序列(IQECVSECISFI);该结果与花生LEC1基因的分析结果相似[23];但是多重比对结果发现多种植物的LEC1蛋白在N端和C端差异性较大。
图3麻风树(图A)和拟南芥(图B)LEC1蛋白功能结构域分析
Fig 3 Analysis of conserved domain ofLEC1 protein ofJatropha(Fig. A) andArabidopsis(Fig. B)
图 4 麻风树LEC1蛋白与其他植物LEC1蛋白序列的多重比对分析
Ah—Arachishypogaea(花生);At—Arabidopsisthaliana(拟南芥);Bn—Brassicanapus(甘蓝型油菜);Dl—Dimocarpuslongan(龙眼);Gm—Glycinemax(大豆);Ha—Helianthusannuus(向日葵);Jc—Jatrophacurcas(麻风树);Mt—Medicagotruncatula(苜蓿);Os—Oryzasativa(水稻);Pc—Phaseolus coccineus(荷包豆);Pic—Pistaciachinensis(黄连木);Pm—Pseudotsugamenziesii(花旗松);Tc—Theobromacacao(可可树);Zm—Zeamays(玉米)。
图 5 麻风树LEC1基因的系统进化分析
使用MEGA6.0软件分析同源性较高的序列,分别采用邻接法和最小进化法构建系统进化树,结果两种方法的进化树结构完全一致。列举图5邻接法分析结果进行分析,结果表明,麻风树LEC1 基因与可可树LEC1-like基因进化关系最为密切;此外,与花生LEC1B和LEC1A、荷包豆LEC1-like、大豆LEC1B和LEC1A基因关系较近,但是与功能已知的玉米、拟南芥和甘蓝型型油菜的LEC1基因关系较远,该结果为后续通过转基因鉴定麻风树LEC1 基因功能的实验提供了参考信息。
目前对LEC1基因的功能研究多集中在拟南芥[13-17]、玉米[19]和甘蓝型油菜[18,20]等草本植物上,而有关木本植物LEC1基因功能研究的报道较少。麻风树拥有生长快、适应性强和种子中富含大量油脂成分等优点,被育种工作者视为生产生物柴油的重要研究材料,更以培育高油脂产量的麻风树优良株系作为主要研究目标[2]。本文选择具有调控种子发育过程和油脂产量功能的拟南芥LEC1基因为参考序列,采用生物信息学方法对麻风树LEC1基因进行了系统的分析,主要结论如下:1)麻风树和拟南芥LEC1蛋白稳定性都较低,均属于亲水性蛋白,它们都是既无信号肽又无跨膜结构域的非分泌蛋白,都主要分布于细胞核中;2)麻风树和拟南芥LEC1蛋白都存在高度保守的CBFD-NFYB-HMF结构域,推测麻风树LEC1基因可能也是转录因子,并且具有与拟南芥相似的功能;3)本文中17种植物LEC1蛋白含有很保守的B结构域,该区域是LEC1蛋白重要的功能结构域;4)麻风树LEC1 基因与可可树LEC1-like基因进化关系最为密切。笔者认为,在后续转基因功能验证的实验中,除了选择拟南芥为受体材料进行异位过量表达和互补突变体表达试验,以及采用已报道的根癌农杆菌介导的麻风树转基因技术[24],直接开展麻风树转基因试验外,还可以分析不同激素处理对转麻风树LEC1基因的受体材料的影响,检测麻风树LEC1基因的表达时空与激素之间是否存在相关性。Yamamoto等[25]研究发现,拟南芥LEC1和LEC1-like基因的表达与脱落酸应答元件的响应结合因子(ABA-response element (ABRE)-binding factor)之间的相互作用有关;此外,最新研究表明,中果咖啡LEC1基因的表达受到表观遗传学调控[26],麻风树LEC1基因是否存在相似的分子调控机制有待进一步分析。2011年,日本科研团队公布了麻风树全基因组测序结果[27],包括其基因组约为285.9 Mb,仅是模式木本植物杨树全基因组(480 Mb)的59.6%[28],它的基因总数共计40929条,却占杨树基因总数(45555)的89.85%[28],测序结果不仅极大地丰富了麻风树的遗传背景,也为将来开展麻风树LEC1基因及其他基因的表达分析和功能验证打下了良好的基础。
本文研究结果为深入研究麻风树LEC1基因的生物学功能奠定了基础,也为麻风树LEC基因家族的克隆分析提供了参考信息,但是,本文是基于生物信息学工具对目标基因进行系统的研究,关于麻风树LEC1基因的时空表达特性、具体的功能特点及分子调控机制等内容亟待进一步的生物学实验研究。
参考文献:
[1]Heller J. Physic nut.JatrophacurcasL. promoting the conservation and use of under-utilized and neglected crops [M]. IPGRI, Gatersleben/International Plant Genetic Resource Institute, Rome, 1996.
[2]Maghuly F, Laimer M.Jatrophacurcas, a biofuel crop: Functional genomics for understanding metabolic pathways and genetic improvement [J]. Biotechnology journal, 2013, 8(10): 1172-1182.
[3]Jones N, Miller J H.Jatrophacurcas: A multipurpose species for problematic sites [J]. Land Resources Series-Asia Technical Department, World Bank, 1992, (1): 1-12.
[4]Francis G, Edinger R, Becker K. A concept for simultaneous wasteland reclamation, fuel production, and socioeconomic development in degraded areas in India: Need, potential and perspectives of Jatropha plantations [C]//Natural Resources Forum. Blackwell Publishing, Ltd., 2005, 29(1): 12-24.
[5]Kumar A, Sharma S. An evaluation of multipurpose oil seed crop for industrial uses (JatrophacurcasL.): A review [J]. Industrial crops and products, 2008, 28(1): 1-10.
[6]Openshaw K. A review ofJatrophacurcas: an oil plant of unfulfilled promise [J]. Biomass and Bioenergy, 2000, 19(1): 1-15.
[7]Gübitz G M, Mittelbach M, Trabi M. Exploitation of the tropical oil seed plantJatrophacurcasL. [J]. Bioresource Technology, 1999, 67(1): 73-82.
[8]Deore A C, Johnson T S. High-frequency plant regeneration from leaf-disc cultures ofJatrophacurcasL.: an important biodiesel plant [J]. Plant Biotechnology Reports, 2008, 2(1): 7-11.
[9]Chen M S, Wang G J, Wang R L, et al. Analysis of expressed sequence tags from biodiesel plantJatrophacurcasembryos at different developmental stages [J]. Plant Science, 2011, 181(6): 696-700.
[10]Fairless D. Biofuel: the little shrub that could-maybe [J]. Nature, 2007, 449(7163): 652-655.
[11]Achten W M J, Nielsen L R, Aerts R, et al. Towards domestication ofJatrophacurcas[J]. Biofuels, 2010, 1(1): 91-107.
[12]Ye J, Hong Y, Qu J, et al. Improvement ofJ.curcasoil by genetic transformation [M]//Jatropha, Challenges for a New Energy Crop. Springer New York, 2013: 547-562.
[13]Lotan T, Ohto M, Yee K M, et al.ArabidopsisLEAFYCOTYLEDON1 is sufficient to induce embryo development in vegetative cells [J]. Cell, 1998, 93(7): 1195-1205.
[14]West M A L, Yee K M, Danao J, et al.LEAFYCOTYLEDON1 is an essential regulator of late embryogenesis and cotyledon identity inArabidopsis[J]. The Plant Cell, 1994, 6(12): 1731-1745.
[15]Meinke D W, Franzmann L H, Nickle T C, et al. Leafy cotyledon mutants ofArabidopsis[J]. The Plant Cell, 1994, 6(8): 1049-1064.
[16]Gutierrez L, Van Wuytswinkel O, Castelain M, et al. Combined networks regulating seed maturation [J]. Trends in plant science, 2007, 12(7): 294-300.
[17]Braybrook S A, Harada J J. LECs go crazy in embryo development [J]. Trends in plant science, 2008, 13(12): 624-630.
[18]Mu J, Tan H, Zheng Q, et al.LEAFYCOTYLEDON1 is a key regulator of fatty acid biosynthesis inArabidopsis[J]. Plant physiology, 2008, 148(2): 1042-1054.
[19]Shen B, Allen W B, Zheng P, et al. Expression ofZmLEC1 andZmWRI1 increases seed oil production in maize [J]. Plant physiology, 2010, 153(3): 980-987.
[20]Tan H, Yang X, Zhang F, et al. Enhanced seed oil production in canola by conditional expression of Brassica napusLEAFYCOTYLEDON1 andLEC1-LIKEin developing seeds [J]. Plant physiology, 2011, 156(3): 1577-1588.
[21]Tamura K, Stecher G, Peterson D, et al. MEGA6: molecular evolutionary genetics analysis version 6.0 [J]. Molecular biology and evolution, 2013, 30(12): 2725-2729.
[22]Lee H, Fischer R L, Goldberg R B, et al.ArabidopsisLEAFYCOTYLEDON1 represents a functionally specialized subunit of the CCAAT binding transcription factor [J]. Proceedings of the National Academy of Sciences, 2003, 100(4): 2152-2156.
[23]李爱芹, 夏 晗, 王兴军, 等. 花生LEC1基因的克隆及表达研究 [J]. 西北植物学报, 2009, 29 (9): 1730-1735.
[24]Kumar N, Vijay Anand K G, Pamidimarri D V N, et al. Stable genetic transformation ofJatrophacurcasviaAgrobacteriumtumefaciens-mediated gene transfer using leaf explants [J]. Industrial crops and products, 2010, 32(1): 41-47.
[25]Yamamoto A, Kagaya Y, Toyoshima R, et al.ArabidopsisNF-YB subunitsLEC1 andLEC1-LIKEactivate transcription by interacting with seed-specific ABRE-binding factors [J]. The Plant Journal, 2009, 58(5): 843-856.
[26]Nic-Can G I, López-Torres A, Barredo-Pool F, et al. New insights into somatic embryogenesis:LEAFYCOTYLEDON1,BABYBOOM1 andWUSCHEL-RELATEDHOMEOBOX4 are epigenetically regulated inCoffeacanephora[J]. PloS One, 2013, 8(8): e72160.
[27]Sato S, Hirakawa H, Isobe S, et al. Sequence analysis of the genome of an oil-bearing tree,JatrophacurcasL [J]. DNA Research, 2011, 18(1):65-76.
[28]Tuskan G A, Difazio S, Jansson S, et al. The genome of black cottonwood,Populustrichocarpa(Torr. & Gray) [J]. Science, 2006, 313(5793): 1596-1604.