摘 "要: 纸币新旧检测是纸币清分机中的一个重要功能,与传统的基于纸币反射图像检测纸币新旧等级不同,采用了纸币的透射图像进行纸币新旧检测。根据纸币的新旧程度人工划分为3个等级,分别使用了基于灰度图像整体亮度的新旧检测法和传统的模式识别的方法,采用纸币透射图像直方图分布作为纸币新旧特征,分别使用了KNN、SVM分类器进行分类,并且提出一种简单的级联分类器。实验结果表明级联分类器比KNN和SVM的单独使用有更好的表现。
关键词: 透射图像; 模式识别; SVM; 级联分类器
中图分类号: TN919⁃34; TP391.41 " " " " " " " 文献标识码: A " " " " " " " " " 文章编号: 1004⁃373X(2015)06⁃0101⁃04
New and old banknotes′ classification based on transmission images
QI Lei, REN Ming⁃wu
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
Abstract: Classification of new or old banknotes is a important function in the banknote sorter. The transmission image is adopted in this paper to detect new or old banknotes. It is different from the traditional new or old banknote detection based on reflection images. According to the new or old degree of banknotes, all banknote samples are divided into three grades. The new or old banknote detection method based on gray level image brightness and pattern recognition method are used respectively. The histogram distribute of transmission image is used as feature of new or old banknotes. The KNN and SVM classifier are employed to carry out classification. A new cascade classifier which combines SVM and KNN is put forward. Test proves the new cascade classifier is more effective than SVM and KNN in detection of new or old banknotes.
Keywords: transmission image; pattern recognition; SVM; cascade classifier
0 "引 "言
纸币清分机是一种集光机电磁于一体的高端金融现金处理设备,其主要功能是对纸币进行面值、面向、新旧程度及纸币序列号的识别。纸币清分机挑选适合在市场中流通的纸币、高效地代替了人工选择可流通纸币的工作。当纸币流通时间过长时,表面会出现粗糙、模糊、磨损等现象。过旧的纸币影响了纸币的真伪鉴别、冠字号识别等,导致货币在市场中的流通带来了不便。根据中国人民银行发布的《不宜流通人民币挑剔标准》,过旧的纸币不宜流通,因此纸币清分机中需要具有检测纸币新旧的功能来满足这样的需求。
早期国外曾根据纸币在清分机中与传送带的摩擦声音来判别新旧[1],但该技术已被数字图像技术[2]所代替。目前,国内纸币清分机产品多采用基于数字图像技术做相关研究[3]。纸币新旧识别成为纸币清分算法的核心和难点,而且新旧等级分的越多,难度越大。目前国内外现有的纸币新旧检测方法有基于纸币反光强度的新旧判别[4⁃5],基于多光谱彩色图像的新旧判别[2],基于标准图像进行灰度直方图匹配来判断纸币新旧[6] 等。目前,对于纸币的新旧检测大多基于反射图像的亮度。近年来也出现了将纸币的新旧检测转换为模式识别的问题,首先提取纸币图像上的有效特征,然后使用分类器来进行新旧识别[7⁃8]。
本文将纸币的新旧程度划分为3个等级,使用纸币的透射图像对纸币进行新旧判断,分别采用了纸币透射图像平均亮度划分图像等级和传统的模式识别的方法,提取了纸币透射图像的灰度直方图分布作为纸币新旧检测特征,并分别采用了KNN(k近邻),SVN(Support Vector Machine支持向量机)分类器,并提出了一种简单的级联分类器。
1 "图像数据说明
本文通过人工划分的方式将100元人民币划分为新旧程度不同的3个等级,并且对于新旧程度不同的纸币分别收集了170张,其中100张作为训练样本,70张作为测试样本。将所有收集得到的纸币采用图像传感器进行双面采样,获得两张图像,白背景图像中的奇偶行分别对应纸币的透射图像和反射图像,黑背景图像中的奇偶行分别对应图像的反射图像和彩色图像如图1所示。本文只使用了纸币的透射图像,只需要将白色背景的图像提取出来,无需判断纸币图像的正反面。本文采集到的所有纸币透射图像都已确定4个角的坐标位置。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T1.tifgt;
图1 原始采样数据分割
2 "基于图像亮度的纸币新旧检测
目前,针对于纸币的新旧检测提出的大多数方法都与纸币的亮度有关,因为新旧纸币在图像采集的时候反光的强弱不同,所得图像的明暗有差异,因此可以根据纸币图像的亮度判定纸币的新旧等级。常用的方法有使用纸币空白区域的平均亮度,纸币反射图像某固定区域的平均灰度值。使用反射图像进行新旧检测时,必须先确定纸币图像的面向,还要定位到纸币的固定的区域。对于纸币透射图像,无论采集到的图像是纸币的正面或反面,所得的透射图像都一样,所以采用纸币的透射图像就不需要检测纸币的面向。采用图像的部分区域进行检测时,当此区域存在涂污时,对纸币的新旧检测结果产生影响。本文采用完整的纸币透射图像亮度的平均值检测纸币的新旧,具有更好的鲁棒性。
在所有训练样本和测试样本中,已经准确标记了纸币的4个顶点的坐标。这样就可以得到纸币边缘具体位置,可以利用行扫描,来统计每张纸币的所有点的灰度值的和,然后求得其平均值,根据平均值与自己设定的标准进行比较就可以得到纸币的新旧等级。但由于纸币在流通的过程中会出现磨损,完整的纸币图像经常存在一些噪声,例如对于过旧的纸币中往往存在细小的孔洞区域和图像边缘检测并非很精确(会残留一些白色背景区域),这就导致了所统计的透射图像的像素点中存在白色的噪声区域如图2所示,因此首先统计纸币透射图像的灰色直方图,然后将根据纸币图像的直方图去除亮度前%α的点和后%α的点,最后计算所有剩余像素点的平均灰度值。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T2.tifgt;
图2 原始图像
基于纸币透射图像平均亮度检测新旧,具体步骤如下:
(1) 统计训练样本中新旧程度最新的样本(本文为等级1)纸币透射图像的灰度直方图,并去除最亮的前%α和最暗的前%α,计算每张纸币的平均亮度,最后计算所有样本平均亮度设为[vmax]。同理计算得到训练样本中新旧程度最旧样本(本文为等级3)的平均亮度设为[vmin]。
(2) 统计待检测的样本的灰度平均值,方法同(1),得到纸币透射图像的亮度为[v]。
step3判定新旧等级,根据以下公式:
[d=v-vminvmax-vmin "等级1, " " " " dgt;t1等级3, " " " " dlt;t2等级2, " " " "其他]
式中[t1]、[t2]根据多次实验获得的阈值。
3 "基于模式识别方法的纸币新旧检测
纸币的新旧检测除了采用图像的整体平均亮度值,近年来也出现了将纸币的新旧检测转换为模式识别的问题,例如文献[9]基于BP⁃LVQ神经网络的纸币新旧识别算法研究,首先提取纸币图像的新旧特征,然后将特征送给分类器识别,得到识别结果,具体过程如图3所示。
3.1 "特征提取
纸币图像的新旧特征一般采用灰度直方图的分布统计,新旧纸币的差异不仅反映在纸币灰度图像的平均值上,在灰度直方图的分布中也有所差异。越新的纸币图像灰度直方图波峰靠后,越旧的纸币图像直方图波峰靠前。对于纸币透射图像也存在同样的表现如图4所示,分别为新旧等级一、二、三纸币透射图像直方图统计分布。统计每张纸币透射图像的直方图,得到256维的特征向量。所得到的特征向量中与基于亮度检测新旧具有同样的问题,图像中的最亮和最暗区域存在一定的噪声,使用上述相同的方法去除亮度前%α的点和后%α的点后统计直方图,得到256维纸币新旧特征,并归一化特征向量。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T3.tifgt;
图3 模式识别方法的流程
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T4.tifgt;
图4 不同新旧程度的直方图
3.2 "KNN
K近邻法(K⁃nearest neighbor,KNN)是由Cover和Hart在1968年提出的[10],它是最近邻法的推广形式,其主要的决策方法也是类似的,当k=1时就是最近邻法。K⁃近邻法是通过找到与待识别样本点最近的k个样本点,根据这k个训练样本的类别,通过多数表决等方式进行预测。因此k近邻法不具有显示的学习过程。k近邻法实际上利用训练数据集对特征向量空间进行划分,并作其分类的“模型”[11],K近邻法中的距离度量一般选用欧式距离。
假设训练样本一共有[N]个,并且分为[n]个类别分别为[w1,w2,…,wn],待识别样本为[x],在[N]个样本中找出与[x]最近[k]个样本,假设这[k]个样本中来自[w1]类的有[k1]个,来自[w2]类的有[k2]个,以此类推,来自[wn]类的有[kn]个,其中[k=i=1nki],定义判别函数:
[gi(x)=ki, i=1,2,…,n]
判别决策规则:如果
[gj(x)=arg maxi "ki , i=1,2,…,n]
则待识别样本[x∈wj]。
3.3 "支持向量机
支持向量机(Support Vector Machine,SVM)是Cortes和Vapnik于1995年首先提出的[12],支持向量机就是能够找出超平面并把空间中的样本进行分类的问题,使其间隔最大化。该方法是基于结构风险最小化原理找到最优决策超平面从而实现分类。假设有训练样本集
[T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈RN,yi∈{-1,+1}]
式中:[xi]为第i个特征向量,[yi]为[xi]的类标记,当[yi=+1]时,[xi]为正实例,当[yi=-1]时,[xi]为负实例,[(xi,yi)]称为样本点。假定训练样本集是线性可分的,学习的目标是找到最佳决策超平面,能将实例分为不同的两类。分离超平面方程为:
[w⋅x+b=0]
分类超平面将特征空间划分为两部分,一部分是负类,一部分是正类,法向量[w]垂直于超平面并指向正类部分。
一般情况下,当可知训练样本可以线性分开的时候,则几何空间中存在了无穷多个分类超平面可以将训练样本分开。但是支持向量机利两个平行向量之间距离最大化求得了最优的分类超平面,这时的解是惟一的,图5为样本在线性可分情况下的支持向量示意图。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T5.tifgt;
图5 SVM线性可分
从图5可以看出,相同的样本训练机可以有不同的划分,(b)图代表着线性可分支持向量机,其中虚线代表最优的分类超平面,与分类超平面最近的样本点称为支持向量。从图5中可以看出,此时两条实线之间的间隔最大。对于线性不可分的样本,可引入松弛变量加以解决。对于SVM分类器进行训练就是求解[w]和[b]的过程,具体过程参考文献[13]。
有时分类问题不是线性可分的,这时就不能用线性可分支持向量机来解决问题,如图6所示。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T6.tifgt;
图6 SVM线性不可分
非线性问题的实质就是把能够将其转化成线性问题。所用的方法,就是构造一个非线性变换,将样本点的特征从一个低维线性不可分空间映射到一个高维线性可分空间。这里,就引入了核函数的概念。
设[χ]是输入空间,H为特征空间,如果存在一个[χ]到H的映射[φ(x):χ→H]对所有的[x,z∈χ]都成立,函数[K(x,z)]满足条件
[K(x,z)=φ(x)⋅φ(z)]
则称[K(x,z)]为核函数,[φ(x)]为映射函数,[φ(x)⋅φ(z)]为[φ(x)]和[φ(z)]的内积。
若直接将输入数据映射到高维空间可能出现维度爆炸现象,可采用核函数在低维空间进行计算,不需要显示的写出映射后的结果,其处理后的结果与高维映射等效。
3.4 "级联分类器
为得到更高的纸币新旧检测的准确率,本文设计了一种级联分类器SVM⁃KNN来判定纸币新旧等级如图7所示,第一级分类器采用SVM,第二级分类器采用KNN,首先使用训练样本对SVM分类器进行训练,得到SVN分类器的模型参数。
当对待检测样本[x]进行分类时,先经过SVM分类器进行分类,获得分类概率最大的两类分别为[w1],[w2],概率分别为[p1]、[p1],当[p1-p2lt;T](其中[T]为设定阈值)进入下一级分类器KNN,分类得到分类结果,否则直接在本级分类器中分类,分类结果为[w1],[w2]中可能性最大的一类。
lt;E:\王芳\现代电子技术201506\现代电子技术15年38卷第6期\Image\14T7.tifgt;
图7 级联分类器
4 "实验结果与分析
本文将纸币新旧程度人工划分成三个等级,一共有300张纸币透射图像用于训练,210张纸币透射图像用于测试。其中每个等级纸币透射图像分别有100张训练样本和70张测试样本,本文分别实验了基于透射图像亮度的新旧判别和传统的模式识别方法,本文采用纸币透射图像灰度直方图的分布作为新旧判别的特征,使用了KNN,SVM,和级联分类器分别实验。基于透射图像亮度检测纸币新旧时参数α,[t1],[t2]分别设为5,0.65,0.2。SVM分类器使用了台湾大学LIBSVM[14],并选用RBF核,阈值[T]设为0.2。实验具体结果如表1所示。
表1 实验结果
实验结果表明在检测纸币的新旧等级实验中使用模式识别的方法明显优于使用图像亮度特征的方法,将SVM分类器和KNN线性级联使用的效果要优于它们单独使用,由于人工选择纸币新旧程度还存在一定偏差,在一定程度上也影响了新旧检测的整体结果。经试验分析误识别结果一般为相邻的两类新旧等级之间。
5 "结 "语
与传统使用纸币反射图像检测新旧等级不同,本文使用了纸币的透射图像对纸币的新旧等级进行检测,分别采用了基于图像整体平均亮度的方法和传统的模式识别方法,选用纸币透射图像灰度直方图的分布作为纸币新旧判别特征,分别使用了KNN,SVM和SVM⁃KNN线性级联的分类器。由于人工划分纸币新旧等级存在一定的误差,对于具体的新旧等级判别的界定比较模糊,如何解决这些问题并提高分类等级的准确性是本文后续研究的重点。
参考文献
[1] TERANISHI M, OMATU S, KOSAKA T. Neuro⁃classification of currency fatigue levels based on acoustic cepstrum patterns [J]. JACIII, 2000, 4(1): 18⁃23.
[2] 李朝.纸币清分机图像处理系统研究[D]. 湘潭:湘潭大学,2012.
[3] 谭家国.纸币图像高速采集系统设计[D].鞍山:辽宁科技大学,2012.
[4] 魏巍.CF1000型纸币清分机图像识别系统的设计与实现[D].哈尔滨:哈尔滨工业大学,2011.
[5] 郭玉佳.纸币图像处理技术研究[D].哈尔滨:哈尔滨工业大学,2009.
[6] 许万征.纸币多光谱图像分析方法[D].哈尔滨:哈尔滨工业大学,2010.
[7] 李庆峰.基于图像处理的纸币清分系统关键算法研究[D].北京:中国科学院,2006.
[8] 魏军.纸币动态检测识别算法研究[D].哈尔滨:哈尔滨理工大学,2009.
[9] 王洪,陈丽,肖思宁.基于BP⁃LVQ神经网络的纸币识别算法研究[J].光学与光电技术,2010,8(4):64⁃67.
[10] COVER T, "HART P. Nearest neighbor pattern classification [J]. IEEE Transactions on Information Theory, 1967, 13(1): 21⁃27.
[11] 李航.统计学习方法[M].北京:清华大学出版社,2012.
[12] CORTES C, VAPNIK V. Support⁃vector networks [J]. Machine Learning, 1995, 20(3): 273⁃297.
[13] BURGES C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121⁃167.
[14] CHANG C C, LIN C J. LIBSVM: a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2011, 2(3): 27⁃30.