1、 人工智能OCR识别处理方案 之电表电量采集 XXX股份 目 录 1 概述 3 1.1 整体介绍 3 1.2 标准 3 1.3 基础平台 4 1.4 电表分类 4 1.4.1 机械表 4 1.4.2 智能电表 6 2 电表数据采集方法 8 2.1 机械表 8 2.2 智能表 9 2.3 注意事项 9 3 目标 10 4 系统实现 11 4.1 系统子系统 11 4.1.1 图片采集层(前端系统) 11 4.1.2 存放及转发(前端系统) 11 4.1.3 云分析(后端系统) 11 4.2
2、填充字段 11 4.3 后期系统智能分析应用计划 12 4.3.1 避免站点交叉抄表 12 4.3.2 用电量趋势分析 12 5 项目预算 12 5.1 按模块拆分 12 5.2 按工作量估计拆分 13 6 名词解释 13 1 概述 1.1 整体介绍 伴随市场此次调研到广安市区域内2077个电表进行试点, 广安全市范围内电表类型及数量见下表: 区县 智能电表 机械电表 广安区 17 496 华蓥市 144 49 邻水县 320 140 前锋区 55 151 岳池县 16 339 武胜县 130 220 累计 682 1395
3、 1.2 标准 人工智能OCR识别处理方案将充足表现前瞻性,包含前期调研、模型训练、平台建设、开公布署、售后保障等部分,期望经过系统成功实施,实现用户价值和本身价值双赢。本处理方案结合了深度学习人工智能最新结果,能在短时间内对OCR识别精度优化和升级。整套方案可独立运行也可无缝嵌入已经有业务系统,最小化首次投入成本。 对于人工智能OCR识别处理方案落地,XXX将充足考虑用户产品布署环境,实现前端图片采集,后端图像OCR识别和比对,实现识别实时性。该方案能应对复杂场景,正确度高,且含有纠错学习能力,能在极短时间内对效果优化和升级。 此处理方案经过私有云调用人工智能接口获取服务,使用加密算
4、法保障内容安全。 方案将表现达成关键目标包含: Ø 对用户指定多个电表样式读数内容进行学习 Ø 实现用户拍摄指定样式电表读数识别 Ø 实现对系统运行中维护和升级 Ø 提供工业级强度安全保护 Ø 提升抄表正确率; Ø 确保抄表作业真实性; Ø 提升抄表智能化水平; 1.3 基础平台 XXX人工智能OCR识别处理方案借助对应内容识别模块正确锁定图片关键内容,包含前端图像视频采集,截图云存放及转发,后端图片云分析,结果输出等。前端图像视频采集由现场代维人员经过代维管理系统APP采集上传,经过初步处理后上传至OCR云识别平台,由相关接口对图片做实时识别并返回结果,供后台分析处理。
5、在业务演进中不停输入标注图片修正深度学习引擎,使其更为智能高效。 1.4 电表分类 1.4.1 机械表 机械表样图1: 机械表样图2: 机械表样图3: 1.4.2 智能电表 智能电表样图1: 智能电表样图2: 智能电表样图3: 2 电表数据采集方法 现场代维人员经过手机APP中,电量采集模块(暂定),将经过手机拍照方法将图片经过APP提交到平台进行智能化图片内容识别,并由平台进行识别后反馈给一线人员确定内容识别正确性 2.1 机械表 2.2 智能表 首先经过按钮进行调整到电量显示界面,然后拍照上传后等候识别
6、结果,并确定后台识别结果,假如后台无误则确定结果,假如后台识别不正确则重新拍照上传识别: 2.3 注意事项 采集图片电量信息必需全部放置在拍照采集虚拟方框以内,以提升有效识别率。 在图片识别软件上将电表数字模块锁定在红色方框内(APP也会在拍照图片上划出虚拟方框,使之将有效数字放入方框内,降低后台对图片内容识别盲目性、降低识别无谓损耗,提升正确识别率和效率);拍照上传,在线等候识别结果,并确定后台识别结果。 3 目标 在网络正常情况下,10秒内平台可识别电费表表盘上读数,并返回给现场人员文字结果,由代维人员进行确定,假如不正确请重新采集。确实因为表本身度数无法
7、看清原因,请上报异常,后续系统会自动开启对应更换、维修步骤; 具体性能以下: ✔支持OCR内容识别; ✔支持大数据训练,频繁迭代; ✔图像识别结果会分为两部分,即确定部分和复审部分,对于确定部分,识别正确度超出人工,达成99.5%以上,无需复审; ✔针对内容审查技术,需人工复审部分通常不超出总图片或视频量5% ; ✔99.5%单张图片响应时间在10s以下; ✔一次请求最高支持50张图片并发; ✔每秒最高支持10次请求; 4 系统实现 4.1 系统子系统 4.1.1 图片采集层(前端系统) 布署在智能终端APP和摄像头经过人工作业,将图片传输到云存放。 4.1.2
8、存放及转发(前端系统) 云存放将存放、备份,并实时以推或拉方法传输给深度学习云做深入分析。截图默认备份30天,可按用户需求导出分析或追溯。 4.1.3 云分析(后端系统) 深度学习云负责图片分析处理,存放,经过OCR识别深度学习算法,对电表读数进行识别,以达成业务监控和商业分析目标。深度学习引擎对识别算法提供了海量特征支持,能够不停学习并优化识别效果,能极快改善误判。 4.2 填充字段 将识别数字串填充到电表度数字段中 电表读数 机房名称 抄表时间 抄表人 联络电话 附件名称(多个以英文,号分开) 包月 甘孜州稻城县稻城中心站综合机房 -05-01 10:24:54
9、0 稻城-中移李庆祥 未填写 凉山雷波丁丁马基站综合机房 -05-01 12:03:14.0 宜通高廷遥 未填写 凉山雷波02基站综合机房 -05-01 12:25:11.0 宜通高廷遥 93613 凉山雷波邮政局家眷区基站综合机房 -05-01 13:32:02.0 宜通高廷遥 包月 甘孜州稻城县日瓦三 -05-01 13:38:54.0 稻城-中移吴明全 未填写 甘孜州德格县岗托基站综合机房 -05-01 15:15:09.0 德格-中移肖伟 白能 雅安宝兴顺城街 -05-01 1
10、9:04:16.0 润建-陈开兵 开下了门 雅安宝兴穆坪北街 -05-01 19:35:05.0 润建-陈开兵 4.3 后期系统智能分析应用计划 4.3.1 避免站点交叉抄表 1. 系统依据历史电量数据进行判定,正常情况下必需大于上一次抄表电量,除非有更换电表或重置情况,避免交叉抄表,造成混乱。 2. 经过代维平台现在成熟作业轨迹功效,进行避免抄错站点。 4.3.2 用电量趋势分析 系统依据历史间隔抄表电量差值和天数比值,得出此次抄表对应比值在一定范围内,假如偏差过大有异常提醒,需要排查原因,比如由冬季到夏季应该有环境温度升高而造成能耗增加。 5 项
11、目预算 5.1 按模块拆分 模块 单项费用测算(万元) 累计(万元) 图片采集层(前端系统)功效软件 100 700 存放及转发(前端系统)功效软件 200 云分析(后端系统)功效软件 400 云资源池统一由四川移动提供支撑,具体配置还需要测算业务模型,并发数据 0 5.2 按工作量估计拆分 模块 工作量(人.天) 单价(元) 小计(元) 累计(万元) 图片采集层(前端系统)功效软件 存放及转发(前端系统)功效软件 云分析(后端系统)功效软件 云资源池统一由四川移动提供支撑,具体配置还需要测算
12、业务模型,并发数据 6 名词解释 OCR (Optical Character Recognition,光学字符识别)是指电子设备(比如扫描仪或数码相机)检验纸上打印字符,经过检测暗、亮模式确定其形状,然后用字符识别方法将形状翻译成计算机文字过程;即,针对印刷体字符,采取光学方法将纸质文档中文字转换成为黑白点阵图像文件,并经过识别软件将图像中文字转换成文本格式,供文字处理软件深入编辑加工技术。怎样除错或利用辅助信息提升识别正确率,是OCR最关键课题,ICR(Intelligent Character Recognition)名词也所以而产生。衡量一个OCR系统性能好坏关键指标有:拒识率、误识率、识别速度、用户界面友好性,产品稳定性,易用性及可行性等。






