收藏 分销(赏)

贝叶斯分类器在手写数字分类识别中的应用.pdf

上传人:自信****多点 文档编号:3713906 上传时间:2024-07-15 格式:PDF 页数:5 大小:2.35MB
下载 相关 举报
贝叶斯分类器在手写数字分类识别中的应用.pdf_第1页
第1页 / 共5页
贝叶斯分类器在手写数字分类识别中的应用.pdf_第2页
第2页 / 共5页
贝叶斯分类器在手写数字分类识别中的应用.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、伺服控制SERVOCONTROL贝叶斯分类器在手写数字分类识别中的应用Application of Bayesian Classifier in Handwritten Digit Classification and Recognition何煦(HeXu)盐城工学院土木工程学院摘要:手写体数字识别技术是一种非常重要的技术,将带来巨大的社会效益和经济效益。但是到目前为止,对手写数字进行识别的准确率仍需要进一步提高。针对这种情况,本文提出了一种基于贝叶斯分类器的手写体数字分类识别方法,能够有效识别书写规范的数字。关键词:图像处理;贝叶斯分类器;手写数字Abstract:Handwritten d

2、igit recognition technology is a very important technology that will bring huge social andeconomic benefits.However,so far,the accuracy of recognizing handwritten digits still needs to be further improved.In response to this situation,this article proposes a handwritten digit classification and reco

3、gnition method based on aBayesian classifier,which can effectively recognize digits with standardized writing.Keywords:Image processing;Bayesian classifier;Handwritten digits【中图分类号】TP753【文献标识码】B【文章编号】1 56 1-0 330(2 0 2 4)0 3-0 0 9 2-0 51“手写字符识别技术”现状手写字符识别包括对在线手写体字符识别和脱机手写体字符的识别。在线手写体识别的基本原理是通过记录下笔与提

4、笔的顺序、位置和中间形成的笔迹的像素位置进行识别。在这一过程中,系统会根据先前设定的规则和编写的程序对写下的信息进行特征提取,将所提取的特征与库的特征进行对比,转化成能够被计算机进行处理的数字信息,在线识别有一个很大的缺陷,那就是需要在类似于手写板的特定的装置上书写。所谓的脱机也就是离线,所有离线识别就是通过像数码相机、扫描仪等图像采集设备,把手写的字符保存为图片的形式,再通过使用数据线输送到计算机并在计算机上识别。近年以来,来自世界各地的研究者们开发了很多方法,这些方法主要有:结构特征、统计特征和人工神经网络等等。基于结构特征的方法通常是记录图像的端点个数、交点个数、弯曲程度、轮廓大小等特征

5、。如果图像过于复杂,可以对预处理过后的图像进行分解,分解为多个小模式乃至基本单元,通过基于统计特征的方法,对划分的基本单元进行统计从而进行分类和识别。92THEWORLDOFINVERTERS但是,不论采取何种识别方法,对图像的预处理操作都是必不可少的。在实验中,使用哪一种方法都不能实现全部识别正确,这表明每种研究方法都是有所缺陷的。2基于“贝叶斯分类器的系统识别方法设计本文主要是解决识别手写体数字图像的问题。由三个主要部分组成:第一部分是对原始图片进行一系列的预处理操作,第二部分是对处理过后的图像进行特征提取,第三部分是设计贝叶斯分类器,对上一个步骤中所得到的特征信息进行处理,并且对设计出的

6、算法进行测试和分析。第一步是图像预处理:预处理是将原始图像转化成二进制格式,再通过计算机进行运算和处理。为了消除噪声和亢余信息,保持点阵规范化是图像预处理的首要目标,从而为图像的分类与识别奠定基础。一般情况下,当把手写数字输入到图像中时,其笔划的粗细、结构的倾斜度等都会在某种程度上造成干扰,比如,其结构特性与字体的粗细有很大关系。手工书写第2 7 卷第0 3期变频器世界2 0 2 4年0 3月造成的笔迹倾斜、笔画粘连等等直接影响图像的清晰度,在预处理过后,可能会出现大面积的黑影,显著降低了图像的质量,对识别产生严重的干扰,这也就直接影响了最后的识别结果的精度。因此,这就对预处理的要求比较高,在

7、充分剔除不相关的信息的同时,又要尽可能地保留原有的特征。在图像识别中,需要针对于不同的图像,选择最合适的预处理过程,然后将其传递给分类算法模块,以提高手写体数字的识别准确率。本次设计的预处理分为三步:灰度化、二值化、去噪。灰度化就是指把原始的RGB图像通过计算机算法变成只体现亮度信息的灰色图像。RGB图片是彩色图像的一种表现形式。三个同样大小的数组可以代表一个像素,每个数组分别表示红、绿、蓝三种颜色的分量。众所周知,红绿蓝是三原色,只要配合不同的比例就可以合成任何颜色,所以每个像素的颜色取决于三种基色所占的比例。如图1 所示。虽然灰度图像与彩色图像相比失去了色彩,但是仍然包含亮度信息,而且这个

8、亮度信息的变化是连续的,依然可以反映出整体和局部的亮度特征。在图像处理中,通常都会使用灰度图像,因为这类图像都是2 56 的调色板,使得图像数据的每个字节就对应一个像素,非常整齐。222图1 灰度化图像图2 二值化图像二值化就是把图像的各个像素分离成“0”和“1”。二值图像就是由成千上万的“o”和“1”构成的矩阵,如图2 所示。这类图像最突出的特点就是占用的空间很小,而且对图像进行布尔运算更为简单快捷。因此,只要是需要进行图像的处理,都少不了图像的二值化。在图像的二值化过程中,最为重要的就是选择最合理的阈值。这个值是用来把灰度值进行分类的。如果某个点的RGB值大于或者等于设定的阈值,那么就规定

9、它的RGB值为“2 55”,即二值图像中的“1”,表示大于或则等于阈值的像素群,反之就规定它的RGB值为“0”,即二值图像中的“0”,表示小于阈值的像素群。要想在最后的分类和识别中获得较高的识别率,二值化图像的笔画必须较好地保持原手写数字图像的数字特征。在MATLAB中,有专门的设定阈值的函数graythresh”,这个函数的功能就是自动选择一个最佳阈值。一般来说,这个阈值要比人为设定的更加精确。图像的二值化对后续处理非常重要,它不仅能有效地压缩图像数据,而且更能突出手写数字的轮廓。一般来说,在图像处理、特征提取、识别之前都需要进行二值化。去噪,即去除二值图像中通常存在的一些黑色或者白色凌乱孤

10、立的点,事实上,这就是孤立点噪声,我们又称之为椒盐噪声。这些噪声会对特征提取时产生或大或小的干扰,如改变数字的轮廓、影响提取的特征等等,从而对识别产生干扰。所以,要想提高识别的精度,就需要采用某种滤波把噪声进行去除。而对于这种椒盐噪声,一般采取中值滤波。第二步是特征提取。特征提取的目标是将高维的模式类别转换成相比之下维数很低的特征空间,并且还能保留图像的本质特征,即保留分类识别需要的信息。很大程度上降低了运算的复杂程度。能从预处理后的图像中提取出属于其本质的特征就是特征提取的主要目的。特征提取分为结构特征提取、像素特征提取、粗网格特征提取三类。结构特征提取,需要对数字的结构进行分析,记录下计算

11、端点、指定方向的交叉点个数,将其作为特征向量,建立起一个特征库。为了实现识别的目的,通过结构特征提取分析图像中的数字结构是一个非常直观的方法。但其不足之处在于,其特征的提取、模板的建立以及匹配算法都是非常复杂的;像素特征提取是针对二值图像而言的,因为这种方法是把处理后的二值图像进行全面扫描,遇到的像素点是黑色就记录这一点的特征为“0”,同理,遇到的像素点是白色就记录这一点的特征为“1”。有许多方法可以提取像素分布,例如水平和垂直投影特征,微结构特征和边缘特征等等;粗网格的特征提取的大体思路就是把需要提取的对象进行切分,分成几个大小几乎相等的网格,然后对每个网格中的像素所占比例进行计算,每个网格

12、中统计出的占比就是相应的特征值,所有的特征值组成的特征向量就是这幅图像的网格特征。本文采用粗网格特征提取的方式,一方面可以确定WWW.CA168.COM93伺服控制SERVOCONTROL待测图像中数字的特征,另一方面还有利于减少人为书写方式不同而产生的干扰,并且这种方法实现起来较为简单。在MATLAB中,编写了Feature_Extraction函数,通过对经过预处理的手写数字图像进行分割,获取数字图像的上下左右的边界,并且命名为“当前手写数字”,并且保存,格式为“bmp”。把保存的图像,通过size函数得到它的维数,除以5并用fix函数进行取整,这样就可以得到55的网格。接着对这2 5个网

13、格中白色像素个数所占网格所有像素个数的比例,得到一个2 5维的特征向量。通过PCA(Principal Component Analysis),主成分分析的降维算法,剔除掉高维度数据中的一些不重要的或者说关联度比较小的信息和变量,既保证保留的都是主要的数据信息,又能降低运算和处理数据信息的复杂程度,减少时间和成本。MATLAB中有现成的函数procov,可以直接调用。其基本原理原理为:在原来特征所在的空间中寻找出一组两两正交的新的坐标轴。因为这种算法需要的是原始数据的方差或者协方差,所以这些新的坐标轴的选取与原始数据是紧密相连的。寻找坐标轴的方法如下:首先,原始数据中方差最大的方向作为第一个坐

14、标轴的方向;接着,在与第一个坐标轴正交的平面中也是寻找方差最大的方向作为第二个坐标轴的方向;然后,在与第一个和第二个坐标轴均正交的平面中还是寻找方差最大的方向最为第三个坐标轴的方向,以此类推。根据这样的方法,就可以得到一组新的坐标轴。如果是N维度的特征投影到M维度,那么这组坐标轴就有N个,并且大多数的方差都集中在前面M个坐标轴上,而在后面的坐标轴上的方差都是接近0 的。这样,就可以把其余的坐标轴都忽略掉,只需要留下前面M个包含绝大多数方差的坐标轴。第三步是贝叶斯分类器设计。贝叶斯分类器是一类分类算法的总称,这类算法均以贝叶斯定理为基础,所以统称为贝叶斯分类器。贝叶斯分类器是有监督的学习算法,其

15、优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美,是流行的十大挖掘算法之一。贝叶斯公式是联系着先验概率与后验概率。要理解贝叶斯公式,首先要了解先验概率和后验概率的概念。先验概率是指在测试之前,由历史经验和分析得出的概94THEWORLDOF INVERTERS率。先验概率通常可分为两种:一种是从历史资料中求出的概率;二是主观上的先验概率,即由主观经验所决定的概率。先验概率是不考虑其他任何条件,仅仅考虑某一事件发生的可能性。后验概率是指将贝叶斯公式与调研等方法相结合,获得新的额外信息,对先前确定的概率进行改正,获得更加准确并且与实际相符合的概率。后验概率公式也是贝

16、叶斯公式,通常使用的形式有两种,其中一种是事件的形式,另一种是随机变量的形式。贝叶斯分类器的工作原理,即利用贝叶斯公式的事件形式,求解在X条件下每个类别的概率,再通过对每个计算出的概率进行比较,选择出概率最大的那一个,就是对应X的预测类别。然而在实际情况每个类别的条件概率往往无法直接求得,所以要利用贝叶斯公式进行求解转化。根据叶斯分类器原理,只要计算出不同数字类别wi的后验概率,所得最大值对应的类别就是预测类别。贝叶斯分类器的计算识别过程如下:(1)计算先验概率P(Wi),由各类样品数和样品总数近似计算:NiP(wi);NNi为数字D的样品数,N为样品总数(2)计算Pj(Wi),再计算类条件概

17、率P(x/Wi):Pi(wi)=2+1|(Ni+2),=,.,=,.24K=0(XeWi这时,设置阈值为0.1,如果其中的0 表示样品X(x0,x1,x2x24)属于wi类条件下,待测对象X的第j个分量为1(xj=1)的概率估计值,由此可以计算条件概率。假设X不论属于哪类数字,这些类的所有样品特征中,第一个分量第一个1/2 5格子的概率值都是0,那么可以认为X的特征值一定为0,取反的情况下才为1。因此,待测对象的类条件概率可得:25P(X|wi)=IIP(xj=a|X e wi),=0orlj-0(3)应用贝叶斯公式求解后验概率,即待测对象X属于wi 的可能性:P(wi)P(Xlwi)P(wi

18、l X)=Z.P(wi)P(XIwi)i=0,1,2,.9,i=0,1,2,.9第2 7 卷第0 3期变频器世界2 0 2 4年0 3月其中P(X)就是上式分母中所训练有X属于不同类别情况相加得到样本的和。测试(4)求得(3)中的每一个后验概样本率的值,最大的那一个值就是识别出来的数字类别。以上基于贝叶斯分类器的手写数字识别系数分为训练和识别两个过程,整体流程如图3所示。其中,训练过程是通过特征提取函数建立样本库,保存在结构体数组pattern中,pattern中包含1 0 个元素,分别为“0”到“9”,每一个元素包含两种属性,分别特征向量个数和数字的特征向量。识别过程是在特征提取之后,通过贝

19、叶斯分类器进行识别,与样本库对比出最相似的结果。如图3所示。3测试过程及结果在MATLAB环境中画出的GUI界面中,导入图片,将图片首先进行预处理,将其灰度化、二值化,得到二值化图像,接着进行特征提取,因为二值化图像是黑白图像,根据0 和1 的分布,寻找图片中只含有数字的边界的位置,并进行切割和保存,使得截取的图片只有数字,去除了空白的边界。这时再进行提取,输出一个特征矩阵,通过贝叶斯分类器算法实现对数字的识别,最后显示出结果。在MATLAB中创建GUI界面。这里有多组测试图像,都是通过Windows系统自带的画图软件书写的。进行选择其中一张读入。在此界面中选择待测手写数字图像,如图4所示。国

20、扫开文鲜新建文件卖OneDrie30对款下乐蒙件(0GAME(F文件名点击“打开文件”按钮,通过对应的回调函数imread读入图像,再依次点击下列按钮:灰度、二值化,可以将原图像进行灰度化、二值化操作,并且在二值化后进行中值滤波,得到滤波后的图像。此时就可以对其进行裁剪和特征提取。选取图片中的任意数字:比如“3”,特征灰度二值化灰度二值化图3识别系统整体流程图如图5所示。EReognition手写数字3二值化图像图5选取数字3操作经过预处理以后,进行特征提取,如图6 所示,然后再识别出选取的数字,如图7 所示。命令行窗口Recognition当前手写数字的特征如下所示:O11 110 0 01

21、101 1 110001111100我图6 数字“3”的特征Recognion5手写数字3Cipg)二值化图像O图4读入数字图像创建去噪提取特征去噪提取灰度图像识别结果灰度图像3识别结果33清除图7 数字“3”识别结果对收集到的40 0 张手写数字图像(每个数字各40 张)逐个识别,结果如表1 所示。WWW.CA168.COM95训练集贝叶斯分类器识别打开文件灰度二位化数学特征识别清除打开文件灰度二值化数字特征输出结果伺服控制SERVOCONTROL表1 手写数字测试结果数字0123456789正确数正确率根据实验测试结果,数字“0”、“1”、“6”、“7 和“9”的识别率最高,误差在5%以下

22、,可能是因为这几个数字结构较为简单,特征比较明显;数字“3”与“8”的识别误差率1 5%,数字“3”和数字“8”弯曲的地方如果没能较为明显地写出来就会识别为“1”,此外,数字“3”下面的弯曲处若写得比较平就可能会识别为“2”。4结论本文基于贝叶斯分类器,通过MATLAB设计模拟了一种手写数字识别系统,测试准确率达9 2.7%,表明贝叶斯分类器用于识别书写比较规范的数字是可行的。但针对略微复杂的数字,如“3”和“8”的识别,以至于更复杂的汉字识别,仍需要进一步完善,除了要增加采样容量之外,还要在提高滤波能力、处理过程中产生的结构失真等方面进行深入的研究。参考文献:1杨淑莹,张桦.模式识别与智能计

23、算Matlab技术实现 M。电子工业出版社,2 0 1 5.2张艳芳:贝叶斯网络在手写数字识别中的应用与研究 D.华北电力大学。3】杨金伟,段会川.脱机手写数字识别方法 J.计算机工程与设计,2 0 0 8,0 2 9(0 2 0):537 9-538 2.4】杨宏伟,数字图像处理技术及其应用 J.电脑迷,2 0 1 8(9):1.5王继成.计算机图像处理技术的探析 J.信息记录材料,2018,19(3):3.6秦玺淳,数字图像处理技术 J.数字通信世界,2 0 1 7,0 0 096THEWORLDOFINVERTERS03823895%14040100%236223690%34233133

24、82.5%413723792.5%7】李治江,丛林,基于朴素贝叶斯理论的彩色图像二值化方法研究 J.数字印刷,2 0 2 0(1):5,8】王辉,基于椒盐噪声的中值滤波法的使用 J.科学技术创新,2020(10):2.9】武威,基于模板匹配与结构特征的字符识别算法研究 D.郑州大学,2 0 1 5.10高强,余军,亢治虎。基于投影特征的简谱数字识别方法 J.软件导刊,2 0 1 5,1 4(6):4.11王玉雷,李永忠,王汝山,粗网格在印刷体藏文特征提取中的应用 J.科学技术与工程,2 0 0 9(1 8):3.12尹东霞,基于主成分分析法及贝叶斯分类器的手写数字识别J.大众科技,2 0 1

25、5(9):3.13蒋良孝,李超群.贝叶斯网络分类器:算法与应用 M.中国地质大学出版社,2 0 1 5.14周国强,崔荣一,基于朴素贝叶斯分类器的朝鲜语文本分类的研究 J.2022(4):16-19.15李隆烨.基于MATLAB的贝叶斯分类器设计 J.科技传播,2019,11(20):2.16周佳敏,基于贝叶斯网络的手写数字识别的研究与应用 J.科技视界,2 0 1 3(8):2.17李伟,基于贝叶斯分类器的图像标注算法研究 D.西安理工大学,2 0 1 5.18王慧,基于模板匹配的手写体字符识别算法研究 D.北京交通大学,2 0 1 2.19陆正球,王麟阁,周春良,基于贝叶斯算法的中文文本分类器设计与实现 J.2022(5):59-61.513723792.5%(012):174,207.62383895%74040100%853413485%92383895%

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服