1、 毕业设计(论文)中期汇报 题 目:病例识别系统实现 院 (系) 计算机科学和技术学院 专 业 计算机科学和技术 学 生 林陶然 学 号 班 号 1203106 指导老师 张英涛 中期汇报日期 4月25日 哈尔滨工业大学教务处制 4月 目录 一. 工作完成情况-----------------------------------------------------1
2、 二. 已完成研究工作及结果-------------------------------------------1 三.现在存在问题及处理方法-----------------------------------------5 四.后期拟完成研究工作及进度安排-----------------------------------5 五.参考文件---------------------------------------------------------6 一、工作完成情况 经过为期一个多月学习研究和不停寻求处理问题措施,我很好地处理了经过手机拍摄医疗
3、表单图像,完成了对于图像灰度处理,二值化处理,倾斜校正,去除杂质处理以后,最终将其中关键数据分行分列从图片中分割出来,最终将分好每一个小块部分进行处理,取得了单个字符,方便我以后将要进行字符识别工作。 二、 已完成研究工作及结果 1. 对图像预处理过程 对图像预处理过程包含图像增强,灰度化,和二值化过程,中值滤波,倾斜校正等等。 在图像进行灰度化处理之前,因为光线环境等等问题,首先对图片进行一次自动增强操作。 调用了autoenhance() 函数,依据预先设定效果范围来调整图像亮度,颜色和对比度。 对图像灰度化处理则直接使用matlab中现有灰度图转化函数rgb2gray()
4、即可。相关这个函数具体内容在此就不再赘述。能够在matlab中查看。 而二值化方法选择就显得尤为要,很大程度上影响了后续分行分列字符提取效果。这里我一开始采取迭代二值化处理方法,并发觉了部分问题。因为拍照光线不均,决定以后将采取自适应阈值法。 1.1中值滤波 Matlab中有现成medfilt2()中值滤波函数可供调用。在此简述一下她实现过程和作用。 中值滤波基础原理就是把一点值用要求该点对应一个邻域中各点值中值来替换。本人所采取是[3*3]窗口大小。 (1)将模板中心和像素点重合; (2)读取模板中各对应像素值; (3)将这些灰度值由小至大排列; (4)取中值替换该像素点
5、值。 中值滤波对孤立噪声像素即椒盐噪声、脉冲噪声含有良好滤波效果。对于本系统来说,它消除杂点有很好效果。 1.2.1迭代二值化方法实现过程 (1)选择一个初始阈值T,T取值方法很简单,整张图片最高灰度值和最低灰度值之和二分之一; (2)将新阈值TT赋值为0,并设置一个范围为allow,d=|T-TT|; (3)遍历整张图片,将灰度值大于T点灰度值作和并除以个数得到平均值T0,同理,将灰度值小于T点作处理得到T1;将T0和T1作平均得到TT,d=|T-TT|。将TT值赋给T (4)假如d值大于等于预先设置范围allow,就反复进行(3)过程直至最终得到一个新迭代阈值T。依据这个T
6、将图片二值化。 1.2.2迭代二值化方法处理结果和分析 (1) 处理结果: 能够看到这种二值化整体效果很好,不过部分文字有笔画丢失现象,而且对于光照不均图像将会产生很多误差点。以下图 (2) 产生误差原因:迭代化二值化方法是对整张图像全部像素点像素值全部基于设定范围作了平均化操作,然而对于光照不均图像,每一个区域阈值allow值全部应该有所不一样,而迭代化二值化方法无法做到所以产生了误差。 而且对于不一样图片要自己选择适宜allow值,不够智能。 1.3对图像倾斜校正 经过对图像倾斜校正能够使二值化以后图像极方便地就能取得后续水平和垂直投影,进而使对整个图像分块和
7、每块中单个字符分割变得正确而又简单。 1.3.1倾斜校正实现过程 (1) 设定参数,并以此参数对二值化后图像进行膨胀过程 (2) 对膨胀后图像进行数学形态学运算bwmorph(BW,'thin',Inf),其中thin表示操作为细化,Inf则表示将一直对图像作一样形态学处理直至不再发生改变。经过这步操作能够将图像缩成连通线。 (3) 经过霍夫函数拟合出细化图片中直线,并计算这条直线斜率,转化为旋转角,对图片进行旋转。即得到了倾斜校正以后图像。 1.3.2 倾斜校正结果和分析 能够看到经过倾斜校正,图片变成了我们熟悉文档格式,有着水平行和垂直列,下面将经过水平和垂直投
8、影,来将每一行每一列信息分割出来。 1.4开运算排除干扰点 倾斜校正以后图像我们能够看到还有很多干扰点,经过开运算函数bwareaopen()能够排除图像中干扰点使分割处理愈加正确。下图为开运算处理效果: 2. 对图像分割处理 因为医疗表单数据通常全部是行列分明而且有着统一格式,字和字之间全部是对齐而且有间距,经过行分割和列分割,将图像分为对应小块,再将每一块中字符进行识别,就能够直接将行和列信息和以后要输出excel表格关联起来,很便捷。 2.1对图像行分割和列分割 在进行行分割和列分割,先要对图片水平和垂直分量进行投影操作,经过观察投影波形图,我们能够清楚地看到每行
9、每列位置和投影波谷对应关系。 2.1.1 水平和垂直投影过程和效果 水平(垂直)投影获取过程很简单,先获取图像纵(横)坐标范围,在这个大小范围内,对每一行(列)像素值进行累加。 能够看到,上图有13行,而水平投影曲线中有13个零点,是相互对应。 2.2.2对图像分块操作 下面将以行分割为例,介绍图像分块过程。 数组H,J分别用于保留一行起点和结束点。 对于x坐标由i到图像高度M遍历,假如有水平投影值由0变为非0,则将i值赋给一个起始点H(j),假如有水平投影值由非0变为0,则将i值赋给一个结束点J(j),而且实施j+1,表示一对起点终点已经成功统计。(即j表示第j
10、个起始点和第j个结束点) 于是就能够得到行切割矩阵rect{i}=[0,H(i),N,J(i)-H(i)];即宽度不变,将每个行起点到行终点部分截取下来,取得逐行图像。切割结果以下: 能够看到结果是很成功。 同理,对于分割出来每一行和之前得到垂直投影,能够将每一行中每一列分割出来,这么就得到了一块一块图像。结果以下: 2.2对每块图像字符分割 只要对之前代码稍作修改,从对整张图变作对每一块进行一次垂直投影,并进行列分割,反复这个过程,直到全部块全部分割完成,我们就得到了一个一个字符图片。 在这个过程中,还能够对分好小块进行筛选,经过设置一个阈值limit来筛掉没有字符块
11、 下图是对上图例子中第九块分块处理结果,能够看到一个一个字符已经被分割出来。 三、 现在存在问题及处理方法 (1) 首先是我采取迭代二值化方法还不足以应付全部条件下拍摄照片。在面对部分效 果不好照片时,会有很多干扰和误差。处理方法:学习自适应阈值二值化方法来对图 像进行二值化,替换现在全部二值化方法。 (2) 在开运算去除杂点以后,有些数据小数点也被过滤掉了。处理方法:在后面识别数据 并进行导出时,假如同一块内两个数字之间留空太大,则说明此处原有小数点,应该补上。 (3) 分割出来每个字符在水平上还有很多空间没有切割。处理方法:对每一块使用之前 行分割过程去掉多出部分来让字符匹
12、配愈加紧速且正确。 (4) 因为医疗数据格式不规律性,分割出来块中有很多是没有信息无效块。处理方法: 加入一个筛选过程,筛掉有效像素点百分比在h以下点。就能够留下只有信息点。 四、后期拟完成研究工作及进度安排 1. 后期工作内容 学习字符识别算法,将分割出来字符分割图片最终转化为文档中文字。 估计方法是先对每个字符图片进行细化还原,再统一化为和模板统一格式,和模板进行匹配对比,得到正确文字。数字和字母和字符识别部分准备在中期答辩以后自己独立完成,研究已经有算法加以改善并实现。汉字部分过于复杂,也会进行一定尝试,假如时间不够话可能会采取现已经有优异方法进行识别。 在成功识别出字符
13、以后,会依据之前对图片中蕴含数据所进行分行分列操作,将这些文字输出到excel表格中对应位置。 依据对大量医疗图片进行试验所得到结果进行正确性和效率调整,优化代码,使整个系统实用性提升,同时确保提取出来数据正确性和有效性。 附加工作:因为这个系统最终是要应用于手机之上,撰写完成业论文以后时间会用来改善代码,并将之转化为C语音程序,用于手机上JAVA语言调用。 2. 进度安排 中期 - -05-15:两周多一点时间用来完成字符匹配和识别; -05-15 - -05-31:做更多试验,碰到问题立即纠正,算法及代码优化和改善; 同时开始毕业论文撰写。 -06-01
14、 - 结题 :完成毕业论文撰写,总结项目中经验和教训。空余时间尝 试代码移植。 四、 参考文件 ① 车牌识别系统中字符分割研究和实现,马婉婕,复旦大学,计算机系统结构, , 硕士 ② 利用Hough变换和先验知识车牌字符分割算法,张云刚;张长水;计算机学报 , Chinese Journal of Computers, 01期 ③ 多个文本图像二值化方法对比分析,童立靖;张艳;舒巍;占国亮;钱垚;北方工业大学学报 , Journal of North China University of Technology, 01期 ④ 不均匀光照文本图像二值化
15、 贺志明;上海工程技术大学学报 , Journal of Shanghai University of Engineering Science, 02期 。 ⑤ 车牌识别系统中牌照定位及倾斜校正技术研究,贡丽霞, 中北大学,应用数学,,硕士 ⑥ 基于Hough变换列车客运票图像倾斜校正, 梁添才;皮佑国;彭晶;朱朝华华,南理工大学学报(自然科学版) , Journal of South China University of Technology(Natural Science Edition),05期 ⑦ 基于内容文档图像倾斜校正, 吕亚军;陈继荣;鹿晓亮,计算机仿真 ,C
16、omputer Simulation, 12期 ⑧ 基于自适应阈值区间广义Hough变换图形识别算法, 宋晓宇;袁帅;郭寒冰;刘继飞;学术论文 (05期) 指导老师评语:
17、 指导老师签字: 检验日期:






