1、 汉王OCR技术 地税行业应用方案 汉王OCR技术在地税部门应用方案 一、背景概述: 我国信息产业技术的不断发展,使得地税行业与IT的结合越来越紧密,各地税局日常工作的信息化成为地税局的首选,由于我国经济水平的不断提高,税收征管工作中的税单录入工作成为地税行业的一大难题,因此需要快捷、准确、高效地实现税单录入存档工作,提高办公效率,缩短税收征管时间, 所有这一切都可通过日益完善的OCR技术加以解决。OCR技术的广泛应用,创造了巨大的社会价值,成为地税行业建立影像索引并替代人工录入工作的重要手段,地税票据业务电子化处理系统对提高地税行业的征管系统的效率,开展
2、对外电子商务业务有很大促进作用。 北京汉王科技公司凭借在OCR识别研发的技术优势,结合地税行业的特点,推出汉王OCR技术在地税行业的解决方案,汉王科技公司将永远致力于地税行业信息技术处理水平的提高,加快税收征管工作的步伐,同时提高税务票据档案管理的工作效率。 二、OCR技术简介: OCR是英文(Optical Character Recognition)的缩写,意为光学字符识别。通过光学扫描仪和计算机的配合,OCR软件将图象数据进行运算分类后,将图象数据转化为计算机内码。可以极大地减轻数据录入工作的强度、提高数据录入的速度。 汉王OCR票据识别系统是OCR产品中最先进、应用效果
3、最好的产品,具有强大的识别功能,同时可以提供表格数据之间的逻辑和算术运算关系,并针对表格形式设计了独特的处理功能,能够满足税务部门对数据的要求。 税务部门将纳税人填写好的报表放到OCR扫描设备上,设备自动扫描读取数据,此OCR系统既可选择单张报表扫描识别,也可选择多张或多用户报表同时扫描识别。如果有填写不清楚的地方,系统会自动提示有误,并将此不清楚的字符的图像单独显示在屏幕上,有操作人员根据图像进行修改,无需重新查找该报表;如果出现运算错误或逻辑关系不对,系统可通过表内数据逻辑运算关系自动检查,并将错误提示出来,有操作人员进行修改,直至完全正确后,生成文本文件,输出到指定的目录。 三、系统
4、结构图: 税务 表格 识别 识别内容 字符识别 正确 表格 有错误表格 表格制作 表格定义 表格扫描 表格识别 数据输出 系统组成:汉王OCR地税行业票据识别系统(SDK),主要应用于税收征管系统,税务票据档案管理系统,个人所得税征收系统的税单识别录入,存档工作。 (一)识别流程图: 地税票据 扫描 图像 识别 手写体识别 票据种类 印刷体识别 正确 错误 人工介入识别 入库存储 (二)工
5、作流程: 1、税务征管系统流程图: 纳税人申报 税务所税务档案 数据处理中心 稽查所税务档案 业务科室税务档案 光盘库 税务档案库房 办公室行政档案库 邮寄 录入 邮寄OCR申报表 录入 图像扫描 原始分析 图 像 扫 描 原 始 文 件 2、税务档案系统流程图: 纳税人 税务分局 OCR录入 订正 邮寄的报表 应用系统数据库 文本数据 手工录入 税务所 错误的报表 更正的报表 手工录入的表格 档案录入 光盘库 图像档案 四、汉王OCR在地税
6、票据识别中应用: 在地税的税收征管工作中,所得税管理处,营业税管理处,地方税管理处,等二十几种税单的录入工作量非常巨大,因此需要汉王OCR技术提供相应的方案来解决地税票据的识别录入问题汉王OCR技术录入速度快,准确率高。 汉王OCR地税票据识别技术主要应用于地税征管处,档案处,由各处相应的录入人员对各种税单进行录入,校对存档.例如对各种税收缴款书的识别录入,象车船使用税等。 地税各征管处,档案处是各种税单录入量最大的机关,尤其是在地税档案处,要对大量税单进行录入,汇总,存档工作.所以更需要汉王OCR识别技术的得力帮助。 汉王OCR技术
7、主要是对定制表格的识别,手写数字,汉字,印刷体数字汉字的识别,而且识别技术一直处于国内领先地位.是国家863计划项目的重要组成部分。 3、地税系统表格录入方式比较(见下图) 企业投资 技术要求 操作 安全性、准确性 较大 较高 较复杂 不安全 磁盘上报 需 购买微机设备及磁盘、 打印机 税 税务人员和纳税人员均 需 具备计算机相应知识 需先将数据录入到计算 机 中,再复制到磁盘中 纳税人计算机可能含有病毒,可能导致税务部门的计算机系统紊乱;且磁盘易损坏 较大 较高 较复杂 不十分安全 IC卡申报 需购买报税机(400-12
8、00 元左右)、IC卡 税务人员和纳税人员均需了解报税机及IC卡、系统软件等知识 录入及修改界面不十分 友好,查询不方便 因为数据存在IC卡里,一旦数据有错误,税务机关不能及时发现更正 非常大 较高 较复杂 不安全 网上报税 需购买专业微机、打印机、调制解调器等设备及相应的软件(几千--几万元),网络传输的费用也比较大 税务人员和纳税人员均需 了解计算机及网络相关知识 纳税人需先录入数据,再 通过网络传输;如果网络有问题,需多次重复传输 因无法建立专用网络,用公用 网络容易导致数据丢失 非常小 很低 很简单 较
9、安全 OCR 每月只需投入表格费用 (约几元钱) 纳税人员只需了解表格的填写方法;税务人员只需了解OCR 设备及相应软件的操作方法 纳税人员需填写几张表 格 数据通过表格传递,有原始资料可查,数据的采集在税务机关进行,可充分保证其安全性 运行环境: Intel Pentium Ⅱ266MH以上处理器 简体中文win95/98/2000,Nt4.0 64M内存以上 五、汉王OCR识别系统的优势 在我国诉讼法规定的七种证据中,并不包括电子数据,电子证据的法律效力亦无明确规定,但可以肯定的是,因为容易伪造和篡改再加上由于人为的因素或环境和技术条件
10、容易出错,电子证据一般不能作为直接证据,这意味着电子证据不能单独、直接地证明事实,即没有独立的证明力。而我国法律实行谁主张权利,谁负责举证的原则,当事人必须就自己所述事实向法庭提供。这就将使用电子数据而无原始凭证的当事人置于不利地位,使电子数据应用领域出现法律关系不稳定局面。 汉王OCR技术正是合适的解决方案。汉王OCR技术是通过光学技术对字符识别,即通过光学扫描仪和识别软件相结合,将手写体数据信息进行录入与处理的一项技术。该技术事实上提供了由手写数据进入抽象的数字化处理空间的入口,数据信息源于手写单据,而最终在计算机系统中得到处理。当数据出现错误或丢失或是系统出现混乱时,可以参照作为原始凭证的手写单据重新处理,而不会出现无据可查的局面。 六、合作方式: 1、与各系统集成商签代理协议书。 2、与客户实行嵌入式合作(SDK),汉王OCR技术可以嵌入地税征管系统中,也可以嵌入地税档案管理系统中。






