沈 飞,黄 怡,周曰春,刘 琴,裴 斐,李 彭,方 勇,刘兴泉
(1.南京财经大学食品科学与工程学院,江苏省现代粮食流通与安全协同创新中心,江苏 南京 210023;2.南京灵山粮食储备库有限公司,江苏 南京 211599;3.浙江农林大学农业与食品科学学院,浙江 杭州 311300)
玉米是世界三大粮食作物之一,但由于玉米原始水分高、胚部大、吸湿性强、脂肪含量高,使其不耐储藏,在储运期间易受黑曲霉、白曲霉等有害霉菌侵染而发生霉变,从而降低玉米品质,甚至产生呕吐毒素、玉米赤霉烯酮等真菌毒素,严重威胁人畜健康[1-2]。因此,如果在玉米储藏、运输和加工过程中,能够快速检测出霉变玉米,可以有效剔除霉变产品,避免受污染的玉米作为饲料或者粮食原料进入消费环节,从而维护人畜身心健康。目前,玉米霉菌侵染的检测方法主要有干片培养法[3]、酶联免疫吸附法[4-5]和荧光检测法[6-7]等。但这些检测手段普遍存在操作繁琐、检测时间长、成本高等问题,不能满足玉米收购、储运和交易时快速检测要求。近年来,近红外光谱和机器视觉技术作为快速无损技术,已广泛用于水果[8-10]、肉类[11-13]等各类食品的检测中,在粮食品质[14-16]、毒素[17-19]检测等方面也开展了一些应用。在玉米分析方面,Chu Xuan等[20]利用傅里叶变换近红外光谱技术对150 个玉米籽粒进行了检测,根据霉变程度(无症状、中度霉变和重度霉变),采用线性判别分析(liner discriminant analysis,LDA)建立模型,校准和验证集的分类精度分别达91.4%和86.7%。Tallada等[21]利用近红外反射光谱和彩色成像对受8 种不同真菌侵染玉米籽粒进行检测,并根据侵染水平进行鉴别,发现近红外(near infrared,NIR)光谱对不同霉变程度样品的判别准确率为89%;而彩色成像能区分75%的未侵染和侵染玉米籽粒。然而,目前绝大多数研究仍停留在静态检测阶段,在线检测方面亟待进一步深入。此外,近红外光谱技术无法有效获取被测样品的外部信息,且容易受外界光、湿度等的噪音干扰,影响检测精度。图像处理检测技术能通过提取颜色、纹理等外部参数来鉴定是否霉变,但不能准确检验内部损伤、轻微病害感染等内部缺陷。因此,将两种技术融合可以同时获得样品的内外部信息,能够更全面评估样品品质,从而提高方法的可信度。
因此,本研究拟以感染不同种类有害霉菌的玉米样品为研究对象,在线获取不同储藏阶段(0、6、9、12 d和15 d)玉米样品的可见-近红外光谱和图像信息,并将提取的玉米样品光谱特征波长和图像特征颜色参数进行融合,结合化学计量学手段建立玉米霉变程度的在线识别方法,并定量预测玉米的菌落总数水平,以探索可见-近红外光谱和图像数据融合技术用于有害霉菌侵染玉米在线检测的可行性。
2017年新收获玉米样品(苏玉20),经南京航空航天大学辐照中心Co-60辐照(剂量:12 kGy)灭菌后装入无菌塑料密封袋,4 ℃冷藏,备用。
5 种玉米中常见有害霉菌:白曲霉(Aspergillus candidus)182448、层出镰刀菌(Fusarium proliferatum)195647、黑曲霉(A. niger)186380、寄生曲霉(A. parasiticus)3.3950和赭曲霉(A. ochraceus)3.3486,均购于中国北京北纳创联研究院。
MCS 600型可见-近红外光谱仪、OMK500-H/NIR漫反射探头 德国Zeiss公司。
1.3.1 霉菌孢子悬浮液制备
将5 种有害霉菌分别接种在马铃薯葡萄糖琼脂(potato dextrose agar,PDA)培养基上,置于28 ℃和85%相对湿度(relative humidity,RH)培养箱内进行培养,待霉菌生长产生大量孢子,用无菌水冲洗培养基的表面菌丝,收集孢子悬浮液于100 mL锥形瓶中,依据GB/T 4789.2—2016《食品微生物学检验 菌落总数测定》中的平板计数法[22]分别统计5 种霉菌孢子悬浮液浓度,并用无菌水调节悬浮液孢子浓度至约1×105CFU/mL,4 ℃冷藏备用。
1.3.2 玉米样品霉菌接种
称取每份约100 g的灭菌玉米样品共270 份,随机分成6 组,每组45 份。玉米霉菌接种步骤为:在室温20 ℃条件下,将玉米样品放置于上方有开孔的灭菌塑料盒(规格:115 mm×115 mm×65 mm)中,用移液枪精确移取1 mL霉菌孢子菌液均匀接种于样品上并充分搅拌均匀。每种霉菌各接种45 个样品,5 种霉菌共计接种225 份样品。剩余45 份样品加入1 mL的无菌水作为空白对照组。以上操作均在无菌环境下操作,接种完毕后转移至6 个不同的人工气候箱(28 ℃和85% RH)中储藏15 d以加速霉变。样品从接种霉菌起,选取储藏时间节点0、6、9、12 d和15 d,从对照组和每种霉菌侵染玉米样品中各随机选取9 份,每次共计45 份样品,样品分析前均放于4 ℃冷藏。
1.3.3 玉米样品可见-近红外光谱和图像在线采集
图1 可见-近红外光谱图像在线检测系统示意图Fig. 1 Schematic diagram of visible/near infrared spectroscopy and image online detection system
图1 为可见-近红外光谱和图像在线检测系统示意图,该系统主要由可见-近红外光纤光谱仪、漫反射探头、数字相机、LED环形光源、遮光箱、传送带和电动机等部分构成。光谱采集步骤如下:将冷藏的样品置于室温下2 h直至样品达到室温。可见-近红外光谱仪预热30 min。将玉米样品放置于直径90 mm培养皿中并平整,将培养皿放置于可调速皮带传送带中线位置处,传送带速率为0.15 m/s。当样品传送至与光谱仪连接的OMK500-H/NIR漫反射探头正下方时采集样品光谱,采集波长范围为560~1 700 nm,积分时间20 ms;每个样品重复装样扫描3 次,取平均光谱进行分析。图像采集步骤如下:将采集完光谱的样品培养皿放置于传送带(铺黑色不反光摄影布作为背景)中线位置处,传送带速率为0.15 m/s;当样品传送至MV-EM120C/M型相机(陕西维视图像公司)正下方时拍摄样品图像,分辨率为1 280×960像素,图片以JPEG格式存储。光谱图像采集完毕后,对所用样品参照国标平板计数法进行玉米菌落总数的测定,将所得结果取对数,以用于后续建模分析。
1.3.4 数据处理与模型构建
采用MATLAB 2015a软件(美国Mathworks公司)对光谱和图像进行处理和建模。首先,运用平滑和多元散射校正等方法对光谱进行预处理[23],并运用正自适应加权算法提取光谱特征波长用于后续模型计算[24]。正自适应加权算法是通过自适应重加权采样技术选择出PLS模型中回归系数绝对值大的波长点,去掉权重小的波长点,利用交互验证选出交互验证均方根误差(root mean squared error of cross validation,RMSECV)最低的子集,可有效获得最优变量组合(特征波长)。运用灰度化、二值化处理、形态学运算、边缘检测等,对图像进行预处理,去除黑色背景部分的无用信息,并提取图像的RGB颜色特征参数(红色、绿色、蓝色)和HIS(色调、饱和度、亮度)颜色模型中的各颜色分量均值和方差作为样品的图像特征参数[25]。最后将提取的光谱特征波长和图像特征颜色参数融合成玉米样品的总特征参数。其次,运用主成分分析(principal component analysis,PCA)分析不同霉变程度样品的聚类趋势;再通过LDA建立不同霉变程度玉米的定性判别模型[26]。最后进行偏最小二乘回归(partial least squares regression,PLSR)分析[27]时,将光谱特征波长、图像颜色特征参数及光谱和图像融合特征参数为自变量,菌落总数作为因变量进行建模。评估PLSR模型性能的指标有:模型决定系数(correlation coefficient of determination,R2)、建模均方根误差(root mean squared error of calibration,RMSEC)和预测均方根误差(root mean squared error of calibration and prediction,RMSEP)、RMSECV和相对分析偏差(residual predictive deviation,RPD)等,其中RPD为预测集标准偏差与RMSEP的比值[28]。模型建立时,随机选取2/3的样品用于模型构建,剩余1/3样品用于模型性能验证。
图2 不同储藏阶段玉米样品菌落总数的变化Fig. 2 Colony counts of control maize samples and samples infected with 5 different fungal species during storage
参考前人研究,根据菌落总数高低可将玉米样品分为未霉变(<3.0(lg(CFU/g)))、霉变(3.0~7.0(lg(CFU/g)))和严重霉变(>7.0(lg(CFU/g)))3 类[29]。如图2所示,接种不同霉菌样品的霉菌菌落总数快速递增,表明样品霉变程度逐渐加深。不同霉菌的增长速率总体差异不大,以黑曲霉186380繁殖速率最快,寄生曲霉3.3950相对滞后。除寄生曲霉3.3950外其他接种样品第12天均已达到严重霉变,而寄生曲霉3.3950样品第15天才达到严重霉变。而未接种霉菌的对照组样品虽然经过辐照灭菌处理,但无法做到与周围环境的完全隔离,其霉菌总数也缓慢增长,第9天时样品仍处于未霉变状态;到第12天时开始处于霉变状态(3.43(lg(CFU/g))),但仍显著低于同一储藏阶段其他接种霉菌的样品。综上,尽管不同霉菌的繁殖速率存在差异,但菌落总数整体呈显著上升趋势,表明样品中霉菌整体的新陈代谢活动旺盛,产生大量次级代谢产物,导致玉米化学组成不断发生变化,同时样品表面也出现霉变区域,为基于光谱和图像信息的霉变分析提供了可能。
图3 储藏第12天时感染不同霉菌及未接种霉菌玉米(a)和感染寄生曲霉3.3950玉米在不同储藏阶段(b)的原始平均光谱图Fig. 3 Average raw spectra of maize samples inoculated or not inoculated with various fungi after storage for 12 days (a) and average raw spectra of maize samples contaminated with A. parasiticus 3.3950 strain at different storage times (b)
图3 a为储藏第12天时未接种霉菌和感染不同霉菌玉米样品的平均可见-近红外光谱图,其他储藏阶段的光谱特征与之类似。感染不同霉菌的样品光谱在600~1 600 nm波长范围内整体相似,存在许多典型的共有光谱,主要吸收峰位于962、1 143 nm和1 411 nm波长处,分别对应于蛋白质、氨基酸和淀粉中N—H和C—H基团的二级振动、水中O—H基团的一级基频振动等[30]。在600~1 200 nm范围内,接种不同霉菌样品的光谱吸光度普遍高于未接种样品的吸光度。在1 200~1 600 nm范围内,除层出镰刀菌组样品外,接种其他霉菌样品的光谱吸光度均低于未接种样品的吸光度。图3b为受寄生曲霉3.3950侵染的玉米样品在不同储藏阶段的平均光谱图。感染其他霉菌样品的光谱差异与之类似,故未列出。观察可知,随着储藏时间的延长,玉米样品的吸光度在962、1 143 nm和1 411 nm等波长处主要吸收峰处呈递减趋势。结果表明,随着霉变程度的加深,霉菌侵染引起的玉米物理和化学变化越来越显著,从而玉米光谱呈现一定的规律性变化。
图4 不同储藏阶段感染不同霉菌及未接种霉菌玉米样品原始图像Fig. 4 Original images of maize samples inoculated or not inoculated with various fungi at different storage times
由图4可知,随着储藏时间的延长,接种霉菌的玉米样品表面颜色发生明显变化,受不同霉菌侵染的样品的图像特征随着储藏阶段的进行差异也越来越显著。第0天感染不同霉菌和未接种霉菌玉米表面均鲜艳有光泽,第9天接种不同霉菌玉米样品表面发生了明显的颜色暗淡、光泽度降低等变化,第12天开始接种霉菌的样品已经严重霉变,样品几乎都被菌丝覆盖,接种寄生曲霉3.3950样品霉变程度低于接种其他4 种霉菌的样品,表面霉变区域较少。第15天所有接种霉菌样品均已达到严重霉变。
分别利用光谱特征波长、图像特征颜色参数及光谱和图像融合特征参数,未接种和接种不同霉菌玉米样品不同霉变程度(未霉变、霉变和严重霉变)的主成分得分如图5所示。所运用的光谱和图像特征数如表1所示。2 个主成分贡献之和在80.71%~93.75%之间,尽管不同霉变程度样品在得分图上的分布区域有部分重叠,但整体上仍存在一定聚类趋势。结果表明,随着储藏时间的延长,霉菌繁殖和代谢导致玉米样品的光谱和图像产生了系统性变化,为进一步的判别分析提供了基础。利用光谱特征波长及利用光谱和图像融合特征参数的聚类趋势略低于单独利用图像特征颜色参数效果。未霉变和霉变样品重叠较多,这可能是由于第12、15天时未接种样品霉变程度较低,与接种霉菌样品出现部分重叠。
图5 未接种和感染不同霉菌的小麦样品随霉变程度的主成分得分图Fig. 5 PCA score plots of control and infected maize samples in terms of mildew degree
将玉米样品依据霉变程度划分为3 类(未霉变、霉变和严重霉变),分别运用光谱特征波长、图像特征颜色参数及光谱和图像融合信息建立不同霉变程度玉米样品的LDA模型见表1,LDA模型能较好区分不同霉变程度单一霉菌侵染样品,基于光谱特征波长对不同霉变程度样品的建模集准确率均为100%,预测集准确率均在86.7%以上。基于图像特征颜色参数对不同霉变程度样品的建模集准确率除对照组(96.7%)外均为100%,预测集准确率均在86.7%以上。其中对照组样品霉变程度不明显导致样品颜色无较大改变,从而判别准确率较低。基于光谱和图像融合特征参数对不同霉变程度样品的建模集和预测集准确率均为100%。当然,受单一霉菌侵染的模型样本集还较为有限(建模集30 个样品,预测集15 个样品),还需要进一步补充样品数量提高模型的稳健性。进一步,当对未接种和接种不同霉菌的全部270 个样品进行综合建模时,基于光谱和图像融合信息的模型同样取得了较优的效果,建模集和预测集准确率分别为98.3%和91.1%,比单独应用光谱和图像时的准确率分别提高4.4%和8.9%。结果说明,随着储藏过程的进行,样品霉变程度加深,可见-近红外光谱融合图像可有效获取样品的内部和外部整体差异信息,在区分样品霉变程度时展现更高的精度优势。
表1 不同霉变程度玉米样品LDA模型判别结果Table 1 LDA discrimination results of maize samples with different mildew degrees
PLSR建模方法分别以光谱特征波长吸光度、图像颜色特征参数及光谱和图像融合特征参数为自变量,玉米样品菌落总数为因变量,选取2/3样品作为建模集,剩余1/3样品作为验证预测集,其定量分析统计结果如表2所示。值、RPD值越大和RMSEP值越小模型性能较优[31]。由表2可知,基于光谱特征波长吸光度、图像颜色特征参数和光谱及图像融合信息对受单一霉菌侵染的玉米样品进行建模和预测时,分别高于0.920和0.890,RMSEC低于0.522(lg(CFU/g)),RMSEP值也较小(0.313~0.728(lg(CFU/g)))。对单一霉菌进行交互验证时,所得RMSECV值也偏低,均小于1.109(lg(CFU/g))。除基于光谱特征波长的层出镰刀菌195647组外,其余各组模型的RPD值均大于3.0,表明模型具有定量分析应用潜力。对所有霉菌侵染的225 份玉米样品和27 份菌落总数不为0的对照组样品综合建立PLSR分析模型,共252 个样品参与建模。结果表明,3 个模型的预测集的值分别为0.851、0.889和0.894,RMSEP分别为0.823、0.717、0.665(lg(CFU/g)),RPD值分别为2.46、2.93和3.06。从结果可以看出,基于光谱及图像融合特征参数建立的PLSR模型效果普遍优于单一光谱和图像技术建立的模型效果,表明该模型鲁棒性较好,预测精度高,可用于定量分析。图6为基于光谱特征波长吸光度、图像颜色特征参数和光谱特征波长及图像特征参数融合信息的所有252 个玉米样品菌落总数实测值与光谱预测值的相关关系图,样品均分布于中心线两侧,表明两者具有较高的相关性。由于样品来源的差异性,模型性能略有下降,但RPD值仍较高,表明模型具有一定的实际检测能力。
表2 玉米中霉菌总数PLSR模型预测分析结果Table 2 Predicted results of colony forming units in maize samples by PLSR model
图6 玉米样品中菌落总数与光谱特征波长(a)、图像特征颜色参数(b)和光谱和图像融合特征参数(c)预测值的相关关系Fig. 6 Correlation between actual colony counts in maize samples and predictions from characteristic wavelengths (a), image color feature parameters (b) and data fusion (c)
可见-近红外光谱可在线获取不同霉变程度玉米样品内部有机分子的基频振动信息,而机器视觉技术可实时获得样品外部的可见光图像信息,两类信息具有不同的来源和属性。本研究的结果表明,PCA、LDA和PLSR等多元统计方法可以有效融合样品的光谱和图像信息,实现其内部与外部信息的综合利用,从而提升在线检测结果的准确性和可信度。当然,本研究仅实现了样品信息的在线采集,将来还需要在检测软件开发、模型嵌入和模型调用等方面进一步研究,以实现真正的在线检测。另一方面,还需要不断补充更多受不同霉菌侵染的玉米样品,以增强模型的稳健性和方法适用性。