摘要:为烟叶油分档次的判别提供参考,以三门峡主产区132份初烤烟叶为样品,评定油分档次后,测定烟叶样品中主要含氮化合物的含量,运用方差分析、Spearman相关性分析和主成分分析筛选出油分档次的判别指标,采用Fisher判别分析建立烟叶油分档次的判别模型。结果表明,不同油分烟叶的含氮化合物中大多数氨基酸含量(19/21)存在显著差异,除脯氨酸外,基本与油分呈显著或极显著负相关。经过主成分分析,从主要含氮化合物中提取出4个主成分,代表了总指标73.441%的信息,筛选出17种烟叶油分的特征含氮化合物。经Fisher判别分析,确定了17种游离氨基酸作为烟叶油分的有效判别指标,构建了烟叶油分档次的Fisher判别模型,训练集和测试集的识别率均为100%。并利用江西吉安和云南楚雄的20份样品对模型进行了验证,准确率分别为100%和80%,对烟叶油分档次的判别效果较好。游离氨基酸的检测结合多元统计分析方法可用于烟叶油分档次的判别。
关键词:烟叶;含氮化合物;游离氨基酸;油分;Fisher判别分析
中图分类号:TS41+1;TS41+3" 文献标志码:A
文章编号:1002-1302(2024)13-0181-07
油分作为烤烟外观质量的重要指标之一,与烟叶的理化特性和感官质量密切相关,在烟叶分级和质量评价中发挥着重要作用[1]。已有的研究表明,油分与烟叶物理特性、化学成分协调性及感官评吸各指标之间存在不同程度的正相关关系,随着油分档次的提高,烤烟的含梗率降低、叶面密度提高,耐加工性增强,烟叶化学成分更加协调,烟叶感官评吸的各项指标得分及总得分也越高[2-3]。即烤烟油分越多,烟叶的品质越好。
目前,针对烟叶油分的主流评价方法仍以烟叶分级中的眼看、手摸并结合其他外观特征对油分进行档次的划分,另有一些学者采用机器学习的方法,通过工业COD摄像头[4]、近红外光谱仪[5]、高光谱成像仪[6]等获得烟叶外观的几何、颜色和光谱特征,利用建模方法对烟叶油分档次进行识别和预测。利用化学成分对烟叶油分进行预测的研究鲜有报道。
化学成分不仅是形成烟草制品感官质量的物质基础,同时也决定了烟草制品的风格与质量,其中含氮化合物作为烟叶中一类重要的化学成分,主要包括烟碱、蛋白质和游离氨基酸,前人的研究已经表明,油分足的烟叶,其总氮、烟碱等的含量都不高[7]。谢利丽等发现,烤烟油分与烟碱含量呈极显著正相关,与总氮含量关系不大[2];刘峰峰等的研究结果表明,中部不同油分烟叶的烟碱含量与总氮含量间未见显著性差异[3];韦克苏等认为,多油分烟叶比少油分烟叶的烟碱、总氮和蛋白质含量低[8]。董洪旭等提出,随烟叶油分变差,其芳香族氨基酸比例以及酸性、碱性、脂肪族氨基酸的含量和比例升高,亚氨基酸比例降低[9];徐磊等报道,除脯氨酸外的多数氨基酸含量及其占游离氨基酸总量比例与烟叶油分呈负相关[10]。以上结果表明,含氮化合物含量与烟叶油分存在较强的关联性,因此,有必要针对主要含氮化合物指标建立评价模型,对烤烟油分进行评价。上述研究均把不同油分档次的烟叶原料限制在特定等级[2-3]或特定部位[8-10],缺乏对于整株全叶位的覆盖,这可能会使结果存在一定的局限性,因此,本研究制取整株全叶位覆盖的不同油分档次烟叶样品对烤烟油分进行评价。
Fisher判别分析又名典型相关分析,能够在现有分组的基础上识别并建立判别函数,从而对新样本进行组别的预测和分类,其优点主要是能在一定程度上克服数据高维距离度量无效性带来的困扰,对多维数据进行降维,对数据的分布没有要求[11]。当前Fisher判别分析广泛应用于医疗、农业、采矿等领域[11-14]。在烟草行业中,Fisher判别分析目前在烤烟香型[15]、品质[16]和卷烟原料档次[17]判别方面有所应用。基于此,本研究以整株全叶位覆盖的初烤烟叶(品种为云烟87)为材料,分析不同油分档次烟叶主要含氮化合物含量的差异,并进行相关性分析和主成分分析,采用Fisher判别分析构建分类模型,对不同油分档次烟叶进行油分判别,并利用江西和云南的烟叶对模型的普适性进行了验证,以期为烟叶油分等级的预测提供参考。
1 材料与方法
1.1 试验材料
采集2022年河南三门峡、江西吉安和云南楚雄的全部位覆盖的代表性初烤烟叶(品种均为当地主栽品种云烟87)。
1.2 样品制备
采用KBF240型恒温恒湿箱(德国Binder公司)平衡初烤烟叶的含水率至16%~18%后,由河南省烟草公司三门峡市公司的9位专业评级技术人员依照GB 2635—1992《烤烟》的标准[18],采用唯一差别原则(即除烟叶油分外,样品的身份、叶片结构、颜色等外观质量尽可能保持一致),将样品分成油分多(Rich)、有(Oily)、稍有(Less Oily)、少(Lean)4个档次,其中三门峡各油分档次的样品共计132份,江西和云南的样品各10份(表1)。
1.3 含氮化合物含量的测定
选取各油分档次烟叶,干燥粉碎,过60目筛,采用YC/T 249—2008《烟草及烟草制品 蛋白质的测定 连续流动法》测定蛋白质的含量(仪器为德国Bran+Luebbe公司的AA3型连续流动化学分析仪);采用文献[19]中的近红外扫描方法测定烟碱、总氮和游离氨基酸的含量;依据文献[20]中的分类方法,将本研究中检测到的21种游离氨基酸分为蛋白类和非蛋白类氨基酸(γ-氨基丁酸)两大类,蛋白类氨基酸再根据侧链结构不同分为8类,包括亚氨基酸、酰胺类氨基酸、含硫氨基酸、酸性氨基酸、碱性氨基酸、芳香族氨基酸、脂肪族氨基酸和含羟基氨基酸。根据各类氨基酸含量与游离氨基酸总量计算出9类氨基酸的占比。
1.4 数据处理
采用Microsoft Office Excel 2019进行数据处理,采用IBM Statistics SPSS 23.0软件进行差异显著性分析、相关性分析、主成分分析,Fisher判别分析采用Origin 2022软件进行,多重比较采用Duncans新复极差法。
2 结果与分析
2.1 不同油分档次烟叶主要含氮化合物的差异
由表2可知,不同油分档次烟叶的烟碱、总氮和蛋白质含量未表现出差异显著性,这与前人的研究结果[3]基本一致,但与谢利丽等的研究结果[2]不同,造成这种结果的原因可能是烟叶产区不同,还可能与本研究采取全叶位覆盖的取样方式,各油分档次中存在多个部位烟叶有关。各油分档次烟叶的9类氨基酸占比中,亚氨基酸占比依次为多油分>有油分>稍有油分>少油分,且差异显著;其余包括酰胺类、含硫类、酸性、碱性、芳香族、脂肪族和含羟基类在内的8类氨基酸占比均随烟叶油分档次由少到多整体呈显著降低趋势;不同油分档次烟叶的游离氨基酸总量略有增加,除丝氨酸和胱氨酸外,不同油分档次烟叶的其他19种游离氨基酸含量均存在显著性差异;其中,脯氨酸含量以多油分烟叶的最高,为12.05 mg/g,显著高于另外3个油分档次烟叶;其余的18种氨基酸含量均随烟叶油分档次由少到多整体呈显著降低趋势,这与董洪旭等和徐磊等的研究结果[9-10]基本一致。
2.2 不同烟叶油分得分与主要含氮化合物的相关性分析
由于油分是定序变量,所以要先把烟叶的4个不同油分档次转换为数据, 目前通用的方法是对油分赋分得到数据[21],这种方法中的多(0~3)、有(gt;3~5)、稍有(gt;5~8)、少(gt;8~10)的分值区间并不相同,对于后续分析可能存在影响。为此,本研究参考并调整了烤烟外观质量的数字化方法[22],对烤烟外观质量中的油分进行4分度数字化表征,多、有、稍有、少油分烟叶分别赋分4、3、2、1。相关性分析采用Spearman相关性分析。
由表3可知,烟叶油分与总氮和蛋白质含量呈显著负相关,与烟碱含量未见显著相关性。谢利丽等研究认为,曲靖烟区烤烟油分与烟碱含量显著正相关,与总氮含量负相关[2]。刘峰峰等针对73个产区的烤烟进行研究,认为烟叶油分与烟碱含量、总氮含量相关性不大[3]。韦克苏等的研究结果表明,贵州产区多油分烟叶的烟碱、总氮和蛋白质含量均低于少油分烟叶[8]。本研究结果与韦克苏等的结论[8]较为一致,而与前两者研究结论不尽相同,这可能与本研究中烟叶样品的部位覆盖度和产区不同有关。
油分与除脯氨酸外的多数游离氨基酸含量呈极显著负相关,与脯氨酸含量呈极显著正相关,与亚氨基酸占比呈极显著正相关,与其余8类氨基酸占比呈极显著负相关,与游离氨基酸总量未表现出明显相关性,这与前人的研究结果[9-10]基本一致。
2.3 不同油分档次烟叶主要含氮化合物的主成分分析
由于总氮含量、9类氨基酸占比及游离氨基酸总量均包含多种含氮化合物,考虑到共线性问题,最终选取烟碱、蛋白质和21种氨基酸含量指标进行主成分分析。对获得的不同油分档次烟叶含氮化合物数据标准化后,进行KMO检验和Barlette球度检验,结果见表4。KMO统计量为0.858(>0.6),Barlette球度检验的相伴概率为0.000(<0.05),表明不同油分烟叶的含氮化合物适合进行主成分分析且效果较好。
经过主成分分析得到了4个主成分。由表5可知,第1主成分的方差贡献率为48.004%,综合了苏氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸和精氨酸含量的信息;第2主成分的方差贡献率为11.080%,综合了脯氨酸和缬氨酸含量的信息;第3主成分的方差贡献率为7.995%,综合了蛋白质含量的信息;第4主成分的方差贡献率为6.362%,综合了胱氨酸含量的主要信息。4个主成分的累计方差贡献率为73.441%,筛选出蛋白质、苏氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸、精氨酸、脯氨酸、缬氨酸、胱氨酸共17种不同油分烤烟的特征含氮化合物。
2.4 基于含氮化合物含量的烤烟油分Fisher判别模型
不同油分档次烟叶中主要含氮化合物含量存在差异,为了对烟叶油分档次进行准确判别,还需要建立基于Fisher判别函数的一般判别方法。以主成分分析中的23种主要含氮化合物含量作为判别分析的自变量,对烟叶样品进行多变量判别分析,筛选出脯氨酸、天冬氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、蛋氨酸、亮氨酸、异亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸、色氨酸、精氨酸共17种对油分档次判别效果显著的含氮化合物,用于烟叶样品的判别模型,利用正态随机数法使132份已分组的样品分散,选取前4/5(105份)样品进行模型的构建,剩余1/5(27份)样品通过交叉验证进行模型准确度的检验,共建立了3个判别函数。
由表6可知,函数1、函数2和函数3的特征值分别为8.959、5.028、1.332,函数3的特征值明显较小;总变异系数分别为58.48%、32.82%和8.69%;进行Willks Lambda检验后(表7),得到各判别函数的显著性分别为0.000、0.000和0.000,在α=0.05的显著水平下,函数1、函数2和函数3均具有判别意义,因前2个函数的累计百分比达到了91.31%,出于简化模型考虑,选择前2个判别函数构建模型。
利用判别函数1和2得到烟叶的判别函数散点图(图1),判别函数1和函数2的系数如表8所示。
由图1可知,4个不同油分档次的烟叶得到了有效区分,组质心未见互相重叠,表明通过含氮化合物对烟叶油分档次进行Fisher判别的效果较好。并建立了Y1(油分多)、Y2(油分有)、Y3(油分稍有)和Y4(油分少)的分类函数模型:
Y1(油分多)=17.449ωPro+0.438ωAsp+0.254ωThr+0.102ωGlu-2.684ωGly+0.208ωAla+0.473ωVal+3.657ωMet+11.383ωIle+0.442ωLeu-0.306ωTyr-0.219ωPhe-0.252ωGABA-0.914ωLys-0.373ωHis+0.448ωTrp+3.264ωArg-297.653;
Y2(油分有)=15.209ωPro+0.435ωAsp+0.148ωThr+0.100ωGlu-2.212ωGly+0.232ωAla+0.410ωVal+4.415ωMet+10.583ωIle+1.169ωLeu-0.540ωTyr-0.223ωPhe-0.248ωGABA-0.666ωLys-0.258ωHis+0.506ωTrp+1.767ωArg-266.947;
Y3(油分稍有)=14.891ωPro+0.402ωAsp+0.340ωThr+0.067ωGlu-2.047ωGly+0.204ωAla+0.396ωVal+3.870ωMet+9.787ωIle+1.724ωLeu-0.092ωTyr-0.178ωPhe-0.220ωGABA-0.688ωLys-0.238ωHis+0.508ωTrp+1.537ωArg-283.251;
Y4(油分少)=15.337ωPro+0.509ωAsp+0.456ωThr+0.106ωGlu-1.984ωGly+0.202ωAla+0.482ωVal+3.264ωMet+11.632ωIle+0.93ωLeu-0.068ωTyr-0.268ωPhe-0.235ωGABA-1.176ωLys-0.316ωHis+0.557ωTrp+3.433ωArg-357.319。
Y1、Y2、Y3、Y4分别表示多油分烟叶、有油分烟叶、稍有油分烟叶、少油分烟叶的判别得分;ωPro、ωAsp、ωThr、ωGlu、ωGly、ωAla、ωVal、ωMet、ωIle、ωLeu、ωTyr、ωPhe、ωGABA、ωLys、ωHis、ωTrp、ωArg分别表示烟草样品中脯氨酸、天冬氨酸、苏氨酸、谷氨酸、甘氨酸、丙氨酸、缬氨酸、蛋氨酸、异亮氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸、色氨酸、精氨酸的含量,其中脯氨酸含量单位为mg/g,其余单位均为μg/g。
烟叶油分档次的判别分析检验结果见表9。由表9可知,训练集的正确识别率为100%,测试集的识别率达到100%,误判率为0。表明采用17种对油分档次判别效果显著的游离氨基酸指标对三门峡烤烟油分档次进行判别的效果好,可实现对烤烟油分档次的区分。
2.5 模型适用性验证
模型验证的结果见表10。该模型对江西吉安10份样品的油分预测准确率达到100%,对云南楚雄10份样品的油分预测准确率为80%,总体上效果较好,该模型具有较强的适用性。
3 结论
通过对三门峡不同油分档次烟叶的主要含氮化合物含量进行分析, 明确了大部分氨基酸含量存在显著差异(P<0.05)。采用主成分分析确定了蛋白质、苏氨酸、天冬酰胺、谷氨酸、谷氨酰胺、甘氨酸、丙氨酸、亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸、精氨酸、脯氨酸、缬氨酸、胱氨酸共17种不同油分烤烟的特征含氮化合物。利用Fisher判别分析方法确定了脯氨酸、天冬氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、蛋氨酸、亮氨酸、异亮氨酸、酪氨酸、苯丙氨酸、γ-氨基丁酸、赖氨酸、组氨酸、色氨酸、精氨酸共17种三门峡烤烟油分档次的有效判别指标,所构建的Fisher判别分析模型的训练集和测试集的识别率均为100%,对其他产区烟叶油分进行判别的效果也较好,具有较强的适用性。
参考文献:
[1]中国烟叶生产购销公司. 烤烟分级国家标准培训教材[M]. 北京:中国标准出版社,2005: 39-40.
[2]谢利丽,卢秀萍,解 燕,等. 曲靖烤烟油分与烟叶品质指标的关系分析[J]. 河南农业大学学报,2015,49(6):742-747.
[3]刘峰峰,董世良,王 波,等. 烤烟油分与烟叶内在质量的关系的研究[J]. 武汉理工大学学报,2019,41(12):45-50.
[4]杜东亮. 烤烟烟叶视觉分级中标准定量化模型的研究[D]. 洛阳:河南科技大学,2008:65.
[5]周汉平,王信民,宋纪真,等. 烟叶结构和油分的近红外光谱预测[J]. 烟草科技,2006,39(1):10-14,29.
[6]叶 磊,韦克苏,李德仑,等. 基于改进RF特征选择策略的烤烟油分高光谱特征分析[J]. 中国农机化学报,2021,42(8):196-202.
[7]钱晓波. 烤烟中西柏三烯醇、糖苷类物质的检测及其与烟叶油润性的关系[D]. 合肥:中国科学技术大学,2014:5.
[8]韦克苏,涂永高,宋泽民,等. 贵州不同油分烟叶化学成分的差异[J]. 湖南农业大学学报(自然科学版),2013,39(5):453-457.
[9]董洪旭,周 芸,黄善松,等. 烤烟游离氨基酸区域性差异及其与外观品质关系[J]. 西南农业学报,2017,30(4):937-944.
[10] 徐 磊,刘 伟,过伟民,等. 烤烟游离氨基酸组分与感官品质的相关分析[J]. 烟草科技,2020,53(10):21-31.
[11]沈海军,张汤磊,许振兴,等. 基于Fisher判别分析对苹果新鲜度的识别研究[J]. 食品工业科技,2023,44(4):361-368.
[12]许章华,黄旭影,林 璐,等. 基于Fisher判别分析与随机森林的马尾松毛虫害检测[J]. 光谱学与光谱分析,2018,38(9):2888.
[13]张忠磊,萧家芳,柏 刚. 评价剪切波弹性成像及Fisher判别分析法对乳腺结节的预测价值[J]. 放射学实践,2022,8(3):390-393.
[14]段李宏,戴 磊,张金陵. 基于Fisher判别模型的煤层底板突水水源预测[J]. 工矿自动化,2022,48(4):128-134.
[15]詹 军,周芳芳,邓国宾,等. 基于化学成分和致香物质的烤烟上部叶香型判别分析[J]. 湖南农业大学学报(自然科学版),2013,39(3):232-241.
[16]单秋甫,张 涛,李 超,等. 基于Fisher线性判别分析方法的卷烟主流烟气质量预测模型构建[J]. 食品与机械,2021,37(2):78-84,92.
[17]邵惠芳,赵昕宇,许自成,等. 基于Fisher判别分析的烤烟感官质量与工业应用价值的关系研究[J]. 中国烟草学报,2011,17(6):13-18.
[18]中国国家标准化管理委员会. 烤烟:GB/T 2635—1992[S]. 北京:中国标准出版社,1992.
[19]季舜华,苏明亮,张 烨,等. 不同叶片结构烤烟化学成分的差异[J]. 烟草科技,2022,55(9):57-64.
[20]沈 晗,葛 炯,王逸枫,等. 福建烟叶游离氨基酸等主要含氮化合物与感官质量的关系[J]. 中国烟草学报,2022,28(5):23-31.
[21]左伟标,蔡宪杰,徐海清,等. 南岭丘陵生态区-焦甜醇甜香型主产区烤烟外观特征研究[J]. 中国烟草学报,2022,28(2):92-100.
[22]张永安,马彩娟,刘立博,等. 烤烟外观质量数字化方法与感官质量相关性分析[J]. 农学学报,2020,10(4):48-52.