1、人工智能OCR识别处理方案之电表电量采集XXX股份目 录1概述31.1整体介绍31.2标准31.3基础平台41.4电表分类41.4.1机械表41.4.2智能电表62电表数据采集方法82.1机械表82.2智能表92.3注意事项93目标104系统实现114.1系统子系统114.1.1图片采集层(前端系统)114.1.2存放及转发(前端系统)114.1.3云分析(后端系统)114.2填充字段114.3后期系统智能分析应用计划124.3.1避免站点交叉抄表124.3.2用电量趋势分析125项目预算125.1按模块拆分125.2按工作量估计拆分136名词解释131 概述1.1 整体介绍伴随市场此次调研到
2、广安市区域内2077个电表进行试点,广安全市范围内电表类型及数量见下表:区县智能电表机械电表广安区17496华蓥市14449邻水县320140前锋区55151岳池县16339武胜县130220累计68213951.2 标准人工智能OCR识别处理方案将充足表现前瞻性,包含前期调研、模型训练、平台建设、开公布署、售后保障等部分,期望经过系统成功实施,实现用户价值和本身价值双赢。本处理方案结合了深度学习人工智能最新结果,能在短时间内对OCR识别精度优化和升级。整套方案可独立运行也可无缝嵌入已经有业务系统,最小化首次投入成本。对于人工智能OCR识别处理方案落地,XXX将充足考虑用户产品布署环境,实现前
3、端图片采集,后端图像OCR识别和比对,实现识别实时性。该方案能应对复杂场景,正确度高,且含有纠错学习能力,能在极短时间内对效果优化和升级。此处理方案经过私有云调用人工智能接口获取服务,使用加密算法保障内容安全。方案将表现达成关键目标包含: 对用户指定多个电表样式读数内容进行学习 实现用户拍摄指定样式电表读数识别 实现对系统运行中维护和升级 提供工业级强度安全保护 提升抄表正确率; 确保抄表作业真实性; 提升抄表智能化水平;1.3 基础平台XXX人工智能OCR识别处理方案借助对应内容识别模块正确锁定图片关键内容,包含前端图像视频采集,截图云存放及转发,后端图片云分析,结果输出等。前端图像视频采集
4、由现场代维人员经过代维管理系统APP采集上传,经过初步处理后上传至OCR云识别平台,由相关接口对图片做实时识别并返回结果,供后台分析处理。在业务演进中不停输入标注图片修正深度学习引擎,使其更为智能高效。1.4 电表分类1.4.1 机械表机械表样图1:机械表样图2:机械表样图3:1.4.2 智能电表智能电表样图1:智能电表样图2:智能电表样图3:2 电表数据采集方法现场代维人员经过手机APP中,电量采集模块(暂定),将经过手机拍照方法将图片经过APP提交到平台进行智能化图片内容识别,并由平台进行识别后反馈给一线人员确定内容识别正确性2.1 机械表2.2 智能表首先经过按钮进行调整到电量显示界面,
5、然后拍照上传后等候识别结果,并确定后台识别结果,假如后台无误则确定结果,假如后台识别不正确则重新拍照上传识别:2.3 注意事项采集图片电量信息必需全部放置在拍照采集虚拟方框以内,以提升有效识别率。在图片识别软件上将电表数字模块锁定在红色方框内(APP也会在拍照图片上划出虚拟方框,使之将有效数字放入方框内,降低后台对图片内容识别盲目性、降低识别无谓损耗,提升正确识别率和效率);拍照上传,在线等候识别结果,并确定后台识别结果。3 目标在网络正常情况下,10秒内平台可识别电费表表盘上读数,并返回给现场人员文字结果,由代维人员进行确定,假如不正确请重新采集。确实因为表本身度数无法看清原因,请上报异常,
6、后续系统会自动开启对应更换、维修步骤;具体性能以下:支持OCR内容识别;支持大数据训练,频繁迭代;图像识别结果会分为两部分,即确定部分和复审部分,对于确定部分,识别正确度超出人工,达成99.5%以上,无需复审;针对内容审查技术,需人工复审部分通常不超出总图片或视频量5% ;99.5%单张图片响应时间在10s以下;一次请求最高支持50张图片并发;每秒最高支持10次请求;4 系统实现4.1 系统子系统4.1.1 图片采集层(前端系统)布署在智能终端APP和摄像头经过人工作业,将图片传输到云存放。4.1.2 存放及转发(前端系统)云存放将存放、备份,并实时以推或拉方法传输给深度学习云做深入分析。截图
7、默认备份30天,可按用户需求导出分析或追溯。4.1.3 云分析(后端系统)深度学习云负责图片分析处理,存放,经过OCR识别深度学习算法,对电表读数进行识别,以达成业务监控和商业分析目标。深度学习引擎对识别算法提供了海量特征支持,能够不停学习并优化识别效果,能极快改善误判。4.2 填充字段将识别数字串填充到电表度数字段中电表读数机房名称抄表时间抄表人联络电话附件名称(多个以英文,号分开)包月甘孜州稻城县稻城中心站综合机房-05-01 10:24:54.0稻城-中移李庆祥未填写凉山雷波丁丁马基站综合机房-05-01 12:03:14.0宜通高廷遥未填写凉山雷波02基站综合机房-05-01 12:2
8、5:11.0宜通高廷遥93613凉山雷波邮政局家眷区基站综合机房-05-01 13:32:02.0宜通高廷遥包月甘孜州稻城县日瓦三-05-01 13:38:54.0稻城-中移吴明全未填写甘孜州德格县岗托基站综合机房-05-01 15:15:09.0德格-中移肖伟白能雅安宝兴顺城街-05-01 19:04:16.0润建-陈开兵开下了门雅安宝兴穆坪北街-05-01 19:35:05.0润建-陈开兵4.3 后期系统智能分析应用计划4.3.1 避免站点交叉抄表1. 系统依据历史电量数据进行判定,正常情况下必需大于上一次抄表电量,除非有更换电表或重置情况,避免交叉抄表,造成混乱。2. 经过代维平台现在成
9、熟作业轨迹功效,进行避免抄错站点。4.3.2 用电量趋势分析系统依据历史间隔抄表电量差值和天数比值,得出此次抄表对应比值在一定范围内,假如偏差过大有异常提醒,需要排查原因,比如由冬季到夏季应该有环境温度升高而造成能耗增加。5 项目预算5.1 按模块拆分模块单项费用测算(万元)累计(万元)图片采集层(前端系统)功效软件100700存放及转发(前端系统)功效软件200云分析(后端系统)功效软件400云资源池统一由四川移动提供支撑,具体配置还需要测算业务模型,并发数据05.2 按工作量估计拆分模块工作量(人.天)单价(元)小计(元)累计(万元)图片采集层(前端系统)功效软件 存放及转发(前端系统)功
10、效软件云分析(后端系统)功效软件云资源池统一由四川移动提供支撑,具体配置还需要测算业务模型,并发数据 6 名词解释OCR (Optical Character Recognition,光学字符识别)是指电子设备(比如扫描仪或数码相机)检验纸上打印字符,经过检测暗、亮模式确定其形状,然后用字符识别方法将形状翻译成计算机文字过程;即,针对印刷体字符,采取光学方法将纸质文档中文字转换成为黑白点阵图像文件,并经过识别软件将图像中文字转换成文本格式,供文字处理软件深入编辑加工技术。怎样除错或利用辅助信息提升识别正确率,是OCR最关键课题,ICR(Intelligent Character Recognition)名词也所以而产生。衡量一个OCR系统性能好坏关键指标有:拒识率、误识率、识别速度、用户界面友好性,产品稳定性,易用性及可行性等。