模式识别课论文.doc_咨信网zixin.com.cn

资源描述

模式识别在手写数字识别中研究摘要：手写体数字识别是文字识别中的一个研究课题，是多年来的研究热点，也是模式识别领域中最成功的应用之一。由于识别类型较少，在实际生活中有深远的应用需求，一直得到广泛的重视，通过对数据采集的预处理，特征提取与选择，建立相应的知识库，应用模式识别的方法来进行研究。关键字：模式识别手写数字识别特征提取预处理 Abstract: Handwritten numeral recognition of character recognition is a research topic, is the hot research topic for many years, but also is one of the most successful application in the field of pattern recognition. Due to the identification type less,it has a profound application requirement in real life, has been widely attention, and through the data acquisition preprocessing, feature extraction and selection, the establishment of the corresponding knowledge base, the application of pattern recognition method for research Keyword: pattern recognition hand-written numeral recognition feature extraction preprocessing 1. 引言手写数字识别(H andw ritten N um eral R ecognition)是光学字符识别技术(O ptical C haracter R ecognition, 简称O C R )的一个分支, 它研究的对象是, 如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个O C R 领域中, 最为困难的就是脱机手写字符的识别, 到目前为止, 尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就, 但距实用还有一定距离。而在手写数字识别这个方向上, 经过多年研究, 研究工作者已经开始把它向各种实际应用推广。字符识别处理的信息可分为两大类：一类是文字信息，处理的主要是用各国家、各民族的文字（如：汉字，英文等）书写或印刷的文本信息，目前在印刷体和联机手写方面技术已趋向成熟，并推出了很多应用系统；另一类是数据信息，主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据，如：邮政编码、统计报表、财务报表、银行票据等等，处理这类信息的核心技术是手写数字识别。因此，手写数字的识别研究有着重大的现实意义，一旦研究成功并投入应用，将产生巨大的社会和经济效益。在整个OCR领域中，最为困难的就是脱机自由手写字符的识别。到目前为止，尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就，但距离实用还有一定距离。而在手写数字识别这个方向上，经过多年研究，研究工作者已经开始把它向各种实际应用推广，为手写数据的高速自动输入提供了一种解决方案。本文首先介绍了自由手写体数字识别的基本原理，包括数字图像预处理、特征提取和模式识别的基本原理和方法；其次介绍了；最后通过基于MATLAB的实验结果，对本系统的性能进行了分析。 2. 手写数字识别的原理手写数字的写法带有明显的地区性和民族性, 因而选择一个可供系统训练和测试使用的样本库是手写数字识别研究的重要基础之一, 对识别系统的性能也有重要的影响。研究者对所需的样本库有两种选择: 一是自己根据需要建立专门的样本库, 二是选用其它机构做好的现成的样本库。本系统主要由手写体数字识别的训练过程和识别过程组成，训练过程和识别过程均包括预处理、特征提取和模式识别三部分，流程图如图2.1 识别过程训练过程数据采集，预处理特征提取与选择分类识别数据采集，预处理分类识别改进数据采集，预处理改进分类识别待识对象训练样本人工干预特征提取与选择改进特征提取与选择正确率测试图2.1 总之，从手写体数字识别原理可见，手写体数字识别技术主要包括以下几点: （1）数据采集预处理，包括彩色图像转成灰度图像、二值化，归一化，滤除干扰噪声等，如下图; 图2.2 原始图像图2.3预处理后图像（2）.特征提取与选择，特征提取是字符识别中的一个重要组成部分，是模式识别的核心之一。经过预处理后，根据识别方法的要求抽取图像特征，作为识别的依据。一般而言，选择的特征一方面要求能够足够代表这个图像模式，另一方面要求它们的数量尽可能少，这样能有效地进行分类和较小的计算量。特征提取的好坏会直接影响其识别的分类效果，进而影响识别率，因此特征选择是模式识别的关键。但是，目前还没有一个有效的、一般的抽取、选择特征的方法。抽取、选择特征的方法都是面对问题的，因此针对不同的识别问题往往有不止一种的抽取、选择特征的方法。本文特征提取的首要任务是要确定细化后图像的那些特征点作为图像的特征，这里只提取图像的结构特征作为网络输入值。其中结构特征有九个，包括竖直中线交点数、竖直1/3处交点数、竖直2/3处交点数、水平1/5处交点数、水平4/5处交点数、右拐点数、左拐点数、上端点数、下端点数。结构特征的选择与提取算法如下述。对经过预处理的图像进行分割，分别在图像的水平区域1/3、1/2、2/3处设置3条竖线，在图像的竖直区域1/3、2/3处设置2条水平线，分别计算直线与图像数字笔段的交点数，求得前五个特征值。如下左图2.4所示：图2.4 再分别提取图像的左拐点数与右拐点数，如上右图2.4所示。以1/3竖交点数为例，提取交点数特征的算法如下： 1) 按从上到下，从左到右的顺序扫描预处理后图像并选择第一个像素点P； 2) 如果P点为黑像素点则选择下一个像素点，若该像素点为白色则对交点数加1，若还是黑像素点则继续选择下一个像素点，如此循环直到该行（列）像素点被遍历完。其他交点数的提取与上述算法类似。以提取左拐点数为例，提取拐点数特征的算法如下： 1) 按从上到下，从左到右的顺序扫描预处理后图像并选择黑像素点P; 2) 查看它右下点是否为黑像素点，如果不是则转1)，否则查看右下点其正下的点，直到新点不是黑像素点，再查看此新点的正左点是否为黑像素点，如果是黑像素点，则这就是一个左拐点。当然由于细化工作的不太确定性，也有可能是此新点的左上角点是黑像素点，那么这也可以看成一个非严格意义上的左拐点。再以图像的上1/3处的水平分割线为界，计算图像的上端点数，以图像的下1/3处的水平分割线为界，计算图像的下端点数。提取端点数特征的算法如下： 1) 从上到下，从左到右的顺序扫描预处理后图像并选择黑像素点P； 2) 计算像素P的8邻域之和N； 3) 若N=1，则像素P为端点，如果端点位于图像的上1/3内，则上端点计数器加一；如果端点位于图像的下1/3内，则下端点计数器加一； 4) 重复步骤1-3，直到遍历整个图像。通过以上方法对数字图像的结构特征进行提取，得到9个数字特征，这9个特征组成一个特征向量，这个特征向量将作为神经网络的输入值。该向量的排列如下： DATA= [ 竖直中线交点数，竖直1/3处交点数，竖直2/3处交点数，水平1/5处交点数，水平4/5处交点数，左拐点数，右拐点数，上端点数，下端点数] 3.知识库的建立由于本文采用的是基于模式知识库的识别方法，所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节，图2.5就是对识别数字的标准形态进行具体分析而构造的模板。图2.5 DATA01＝[2,2,2,2,2,2,2,2,0]； DATA11＝[1,0,0,1,1,1,1,1,2]； DATA21＝[3,3,3,1,1,1,1,1,3]； DATA31＝[3,2,3,1,1,1,2,2,3]； DATA41＝[1,1,1,2,2,1,3,2,4]； DATA51＝[3,3,3,1,1,1,2,2,4]； DATA61＝[3,3,2,1,1,2,3,2,1]； DATA71＝[2,2,2,1,1,1,1,1,2]； DATA81＝[4,4,4,2,2,2,2,2,0]； DATA91＝[3,3,3,1,2,1,3,1,1]。由于本系统是对自由手写体进行识别, 因而要考虑数字书写体的多变性。通过对图2.6所示数字变体的分析来对知识库进行补充。图2.6 DATA02＝[1,1,2,2,2,2,1,2,2]； DATA22＝[3,2,2,1,1,1,1,3,2]； DATA32＝[3,1,4,2,1,1,2,2,3]； DATA42＝[1,2,2,3,3,1,2,2,2]； DATA52＝[3,3,3,1,1,1,2,2,4]； DATA62＝[3,1,3,1,1,2,2,2,2]； DATA82＝[4,4,4,2,1,2,1,2,2]； DATA92＝[3,2,3,2,1,1,3,1,3]。最后得到知识库由上述两套模板所组成。 4.模式识别的方法在本次设计过程中，我们选择了模板匹配的识别方法。通过计算欧氏距离来衡量匹配程度。本系统中的特征矢量有9个分量，其计算距离公式如下：公式(2.1) 但在本次设计中我们计算距离时对上述公式进行了改进，对于可靠性较高的端点数即最后一维特征值加大了权重，改进后的距离计算公式如下：公式(2.2) 在识别过程，分别计算待识别图像的特征值与知识库中两个模板的距离，与10个数字逐个比较，距离最小的对应的数字就是最后识别结果。该算法具有特征提取和模板建立都比较直观，时间复杂度低，易于实现等优点。其缺点是在建立知识库时需要进行大量的训练，当知识库中的模板增多时，特征矢量间的距离会减小。 5.结论本文对自由手写体数字识别的基本原理及方法作了介绍，分析表明，基于所用结构模型和知识库的识别方法对规范手写体数字是可行的，具有较高的识别率及较好的抗噪性能，也可以识别一定条件下的自由手写体数字。为了提高识别率和可靠性，除了要增强对噪声的滤除能力外，还要增大知识库，以解决细化中出现的结构畸变问题，这些都有待我们进一步的研究。 6.参考文献 [1]边肇祺张学工等编著《模式识别》第二版 [2] 计算机时代2007 年第3 期 [3] 章毓晋.图象处理和分析.北京:清华大学出版社[M], 2003. [4] 武汉科技大学学报吴谨《自由手写体数字识别系统的设计与实现》

展开阅读全文