资源描述
人工智能OCR识别处理方案
之电表电量采集
XXX股份
目 录
1 概述 3
1.1 整体介绍 3
1.2 标准 3
1.3 基础平台 4
1.4 电表分类 4
1.4.1 机械表 4
1.4.2 智能电表 6
2 电表数据采集方法 8
2.1 机械表 8
2.2 智能表 9
2.3 注意事项 9
3 目标 10
4 系统实现 11
4.1 系统子系统 11
4.1.1 图片采集层(前端系统) 11
4.1.2 存放及转发(前端系统) 11
4.1.3 云分析(后端系统) 11
4.2 填充字段 11
4.3 后期系统智能分析应用计划 12
4.3.1 避免站点交叉抄表 12
4.3.2 用电量趋势分析 12
5 项目预算 12
5.1 按模块拆分 12
5.2 按工作量估计拆分 13
6 名词解释 13
1 概述
1.1 整体介绍
伴随市场此次调研到广安市区域内2077个电表进行试点,
广安全市范围内电表类型及数量见下表:
区县
智能电表
机械电表
广安区
17
496
华蓥市
144
49
邻水县
320
140
前锋区
55
151
岳池县
16
339
武胜县
130
220
累计
682
1395
1.2 标准
人工智能OCR识别处理方案将充足表现前瞻性,包含前期调研、模型训练、平台建设、开公布署、售后保障等部分,期望经过系统成功实施,实现用户价值和本身价值双赢。本处理方案结合了深度学习人工智能最新结果,能在短时间内对OCR识别精度优化和升级。整套方案可独立运行也可无缝嵌入已经有业务系统,最小化首次投入成本。
对于人工智能OCR识别处理方案落地,XXX将充足考虑用户产品布署环境,实现前端图片采集,后端图像OCR识别和比对,实现识别实时性。该方案能应对复杂场景,正确度高,且含有纠错学习能力,能在极短时间内对效果优化和升级。
此处理方案经过私有云调用人工智能接口获取服务,使用加密算法保障内容安全。
方案将表现达成关键目标包含:
Ø 对用户指定多个电表样式读数内容进行学习
Ø 实现用户拍摄指定样式电表读数识别
Ø 实现对系统运行中维护和升级
Ø 提供工业级强度安全保护
Ø 提升抄表正确率;
Ø 确保抄表作业真实性;
Ø 提升抄表智能化水平;
1.3 基础平台
XXX人工智能OCR识别处理方案借助对应内容识别模块正确锁定图片关键内容,包含前端图像视频采集,截图云存放及转发,后端图片云分析,结果输出等。前端图像视频采集由现场代维人员经过代维管理系统APP采集上传,经过初步处理后上传至OCR云识别平台,由相关接口对图片做实时识别并返回结果,供后台分析处理。在业务演进中不停输入标注图片修正深度学习引擎,使其更为智能高效。
1.4 电表分类
1.4.1 机械表
机械表样图1:
机械表样图2:
机械表样图3:
1.4.2 智能电表
智能电表样图1:
智能电表样图2:
智能电表样图3:
2 电表数据采集方法
现场代维人员经过手机APP中,电量采集模块(暂定),将经过手机拍照方法将图片经过APP提交到平台进行智能化图片内容识别,并由平台进行识别后反馈给一线人员确定内容识别正确性
2.1 机械表
2.2 智能表
首先经过按钮进行调整到电量显示界面,然后拍照上传后等候识别结果,并确定后台识别结果,假如后台无误则确定结果,假如后台识别不正确则重新拍照上传识别:
2.3 注意事项
采集图片电量信息必需全部放置在拍照采集虚拟方框以内,以提升有效识别率。
在图片识别软件上将电表数字模块锁定在红色方框内(APP也会在拍照图片上划出虚拟方框,使之将有效数字放入方框内,降低后台对图片内容识别盲目性、降低识别无谓损耗,提升正确识别率和效率);拍照上传,在线等候识别结果,并确定后台识别结果。
3 目标
在网络正常情况下,10秒内平台可识别电费表表盘上读数,并返回给现场人员文字结果,由代维人员进行确定,假如不正确请重新采集。确实因为表本身度数无法看清原因,请上报异常,后续系统会自动开启对应更换、维修步骤;
具体性能以下:
✔支持OCR内容识别;
✔支持大数据训练,频繁迭代;
✔图像识别结果会分为两部分,即确定部分和复审部分,对于确定部分,识别正确度超出人工,达成99.5%以上,无需复审;
✔针对内容审查技术,需人工复审部分通常不超出总图片或视频量5% ;
✔99.5%单张图片响应时间在10s以下;
✔一次请求最高支持50张图片并发;
✔每秒最高支持10次请求;
4 系统实现
4.1 系统子系统
4.1.1 图片采集层(前端系统)
布署在智能终端APP和摄像头经过人工作业,将图片传输到云存放。
4.1.2 存放及转发(前端系统)
云存放将存放、备份,并实时以推或拉方法传输给深度学习云做深入分析。截图默认备份30天,可按用户需求导出分析或追溯。
4.1.3 云分析(后端系统)
深度学习云负责图片分析处理,存放,经过OCR识别深度学习算法,对电表读数进行识别,以达成业务监控和商业分析目标。深度学习引擎对识别算法提供了海量特征支持,能够不停学习并优化识别效果,能极快改善误判。
4.2 填充字段
将识别数字串填充到电表度数字段中
电表读数
机房名称
抄表时间
抄表人
联络电话
附件名称(多个以英文,号分开)
包月
甘孜州稻城县稻城中心站综合机房
-05-01 10:24:54.0
稻城-中移李庆祥
未填写
凉山雷波丁丁马基站综合机房
-05-01 12:03:14.0
宜通高廷遥
未填写
凉山雷波02基站综合机房
-05-01 12:25:11.0
宜通高廷遥
93613
凉山雷波邮政局家眷区基站综合机房
-05-01 13:32:02.0
宜通高廷遥
包月
甘孜州稻城县日瓦三
-05-01 13:38:54.0
稻城-中移吴明全
未填写
甘孜州德格县岗托基站综合机房
-05-01 15:15:09.0
德格-中移肖伟
白能
雅安宝兴顺城街
-05-01 19:04:16.0
润建-陈开兵
开下了门
雅安宝兴穆坪北街
-05-01 19:35:05.0
润建-陈开兵
4.3 后期系统智能分析应用计划
4.3.1 避免站点交叉抄表
1. 系统依据历史电量数据进行判定,正常情况下必需大于上一次抄表电量,除非有更换电表或重置情况,避免交叉抄表,造成混乱。
2. 经过代维平台现在成熟作业轨迹功效,进行避免抄错站点。
4.3.2 用电量趋势分析
系统依据历史间隔抄表电量差值和天数比值,得出此次抄表对应比值在一定范围内,假如偏差过大有异常提醒,需要排查原因,比如由冬季到夏季应该有环境温度升高而造成能耗增加。
5 项目预算
5.1 按模块拆分
模块
单项费用测算(万元)
累计(万元)
图片采集层(前端系统)功效软件
100
700
存放及转发(前端系统)功效软件
200
云分析(后端系统)功效软件
400
云资源池统一由四川移动提供支撑,具体配置还需要测算业务模型,并发数据
0
5.2 按工作量估计拆分
模块
工作量(人.天)
单价(元)
小计(元)
累计(万元)
图片采集层(前端系统)功效软件
存放及转发(前端系统)功效软件
云分析(后端系统)功效软件
云资源池统一由四川移动提供支撑,具体配置还需要测算业务模型,并发数据
6 名词解释
OCR (Optical Character Recognition,光学字符识别)是指电子设备(比如扫描仪或数码相机)检验纸上打印字符,经过检测暗、亮模式确定其形状,然后用字符识别方法将形状翻译成计算机文字过程;即,针对印刷体字符,采取光学方法将纸质文档中文字转换成为黑白点阵图像文件,并经过识别软件将图像中文字转换成文本格式,供文字处理软件深入编辑加工技术。怎样除错或利用辅助信息提升识别正确率,是OCR最关键课题,ICR(Intelligent Character Recognition)名词也所以而产生。衡量一个OCR系统性能好坏关键指标有:拒识率、误识率、识别速度、用户界面友好性,产品稳定性,易用性及可行性等。
展开阅读全文