1、超高压输电公司纸质档案数字化加工技术作业指导书 超高压输电公司纸质档案数字化加工技术作业指导书EHVDA-04-5-20111 前言档案是机关、组织和个人在社会活动中直接形成的、保存备查的文字、图表、音像及其他各种形式和载体的历史纪录。档案资料是社会知识的积累,更是企事业单位的宝贵知识财富。传统的档案保存,一般采用纸张和缩微胶片两种保存方式。不支持网络查询,与当前高速发展的信息时代是不相适应的。现在将电子影像技术、海量存储技术和计算机网络技术应用于档案管理。首先,通过先进的高速文档扫描仪将纸张文档转换成电子影像;然后,根据一定的归档机制建立影像文件的索引,形成一个方便可靠而又完整的电子档案库;
2、最后,用户可以通过Intranet/Internet对档案进行查询、OCR识别等操作。2 范围本规范规定了纸质档案电子化加工的主要技术要求,以保证超高压输电公司档案电子化加工质量。本规范适用于对各种纸质档案(包括文书档案、科技档案、照片档案等)的扫描电子化加工处理。3 电子化加工要求3.1 总则超高压输电公司档案管理信息系统对纸质档案数字化的关键要求是:对于300dpi和200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi的前提下,保证图像的清晰和OCR识别,其中“手写体文档、地形图纸文档、照片档案”不作OCR识别。根据超高压输电公司的实际,采用以件(文件)为单位的多页tif的存储
3、格式,tif格式的压缩算法黑白采用CCITT GP4、灰度和彩色采用LZW。保证电子化影像的完整性和顺序的正确性。文书档案要求把加工的文件内容区分为:收文办文单+正文+附件为一个文件,正式红头文件+附件+发文稿为一件,底稿不作扫描处理,以便对文书档案原文信息检索利用的权限进行有效的控制。密级文件一律不扫描,有目录的要建索引,但不挂电子原文。3.2 数字化最终成果的技术规范3.2.1 扫描方式文本材料、黑白照片采用黑白二值图像,对于300dpi和200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi,存储格式为单页tiff格式,采用CCITT group4压缩算法;彩色照片档案宜采用真
4、彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用JPEG压缩算法;彩色和带灰度的图纸材料采用8位灰度或真彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用LZW压缩算法;保证图像的清晰和OCR识别,其中“手写体文档、图纸文档、照片”不作OCR识别;3.2.2 图像质量要求图像页面清楚,要求去除数字图像中的杂点、黑边等。数字图像的文字水平偏斜角度小于 1 度,图像水平偏斜不超过页面内半个文字。(视原件的倾斜程度)3.2.3 图像命名方式及存储结构:对加工合格的成果文件进行批量挂接上传,存储结构为:加工的多页TIF文件存放于光盘根目录的image文
5、件夹下,相应的档案著录信息数据库文件在光盘根目录下,名为archive.mdb。多页TIF文件命名: 案卷形式:以案卷档号+卷内序号命名多页TIF文件,如:1001-8201-1-1.tif。 件盒形式:以文件档号命名多页TIF文件。如:2005-102-1.tif3.2.4 数据库(archive.mdb)的结构:科技档案结构 案卷目录目录代号分类号分类名称案卷号档号案卷题名保管期限立卷单位移交单位立卷人检查人文字页数图纸页数总页数件数起始日期终止日期案卷年度密级归档日期检查日期归档份数库位号互见号责任部门检索号备注变更情况库位号套数卷盒规格接收日期总登记号检索号标段案卷年度档案馆号备考表说
6、明 卷内目录目录代号分类号分类名称文件档号责任者文件题名文件日期保管期限主办部门文图号保管期限文字页数图纸页数文件页数页次密级载体类型年度主题词接收日期总页数文种互见号图幅附件数量有无备品设备号文本项归档份数备注kword说明:kword=案卷档号+卷内序号文书档案结构 案卷目录(传统文书)目录代号年度档号案卷号保管期限机构代码案卷题名案卷年度起始日期终止日期互见号文件件数总登记号室编起始件号室编终止件号总页数分类号分类名称密级库位号立卷人立卷日期检查人检查日期卷内文件情况说明备注 卷内目录(传统文书)目录代号年度序号保管期限机构代码题名文号责任者密级页数页次成文日期互见号库位号案卷号分类号分
7、类名称归档份数载体类型文种紧急程度文字纸张规格来文分类号备注kword说明:kword=文件档号 盒目录(文件管理)年度保管期限分类号分类名称盒号总页数主办部门检查日期室编起始件号室编终止件号整理人检查人整理日期卷盒规格盒内文件情况说明密级库位号备注 文件目录(文件管理)年度件号分类号分类名称档号题名成文日期文号来文分类号责任者页数主办部门保管期限密级紧急程度文字载体类型纸张规格文种互见号归档份数归档日期收发文类型备注kword4 档案扫描加工流程4.1 文件加工流程图前期处理档案拆钉整理图像扫描图像优化图像核查补扫图像分份提卷-档案出库、点交/点收目录索引校对品质检查抽查刻录光盘档案装钉查还
8、卷-档案入库、点交/点收序号步骤要求及标准1提卷提卷人与档案全宗单位专职人员清点资料出库、入库数量,填写提卷/还卷单,双方签字确认交接。2前期处理按超高压输电公司文书档案管理办法、超高压输电公司档案业务工作规范进行规范处理。3拆钉起钉、拆线。4整理文书:1、每个年度(目录号)以档号从小到大的顺序排列;卷内封面、卷内目录、卷内备考表、不扫描,重复资料只要一份;2、编写页号:统一编写在正面的右上角,反面的左上角;大小为12平方厘米。对原页号编制不规范的进行修正。卷内封面、卷内目录、卷内备考表。3、对案卷级档案的加工,在每份起始页号旁打三角符号,便于索引;4、如有漏编、错编、重编,均应修正重编。重号
9、的文件,要剔出,放到最后一个档号。要保持编号的顺序和连惯性不能断号、缺号。科技:1、每个项目以档号从小到大的顺序排列;“案卷封面”、“卷内目录”、“卷内备考表”、“图纸目录”不编页号、不扫描;页号编写在右下角,大小为12平方厘米;在每份起始页号旁打三角符号,便于索引;2、原件有破损的,要用A4幅面的纸进行托裱。3、对小于A4幅面的文件材料要用A4规格的纸托裱。对大于A4幅面的文件材料要拆叠成A4幅面。4、对按标准整理完成的档案,用铅笔在文件上填写档号。5、如有漏编、错编、重编,均应修正重编。档号、序号重号的要剔出,放到最后。要保持编号的顺序和连惯性不能断号、缺号。序号步骤要求及标准5扫描1整页
10、图像有效内容要求扫描清晰、不变形、扫描完整(视原件);2扫描时必须逐页核对页号是否正确;3不能有漏扫、重扫、错扫,以及顺序错误。6优化1、数字图像的文字水平偏斜角度小于1度,图像水平偏斜不超过页面内半个文字。(视原件的倾斜程度);2、不能优掉有效信息及页码,优化范围为图纸全版面;3、图像四周不能存在大量黑边、黑点、黑线。7核查补 扫将扫描完成的资料,逐一检查,对漏处理的黑边、纠斜、脏点进行处理并进行记录,形成合格成品。8分份在加工系统中进行文件标记分隔, 以便建立扫描影像和目录索引对应关系。9索引以电子化加工图像文件为依据,按照档案管理信息系统著录字段和信息建索引。盒文件目录有的条目,但无文件
11、实体或未扫描的文件,要建目录索引并保持原有档号。10校对索引目录和实物档案要一一校对,发现问题记录并统一修改。11质检对加工好的影像数据库进行检查,对超过规定值的不合格产品返回车间,合乎标准的进入下一流程。12抽查准成品按照5%的量抽查,有一件不合格,全部返回车间。13刻盘合格产品刻录光盘。14装订1、已装订的案卷经拆除扫描后,要恢复原状;3、对准备装订的资料逐页核查顺序、方向、整齐程度;3、装订采用1-10 页的用不锈钢订书针,10页以上采用“三孔一线”,左下对齐方式装订,有卷内封面装订的案卷,卷内目录及备考表均一并装订在卷内封面内,不能装订到有效信息;4、孔至底边的距离为7.0CM,每个孔之间间距为7.5CM,孔与资料背脊间距1.0CM。15检查检查档案的还原质量。加工成品中我漏扫、错扫的一律补扫。16还卷将加工完成的档案归还、入库,双方负责人清点交接, 在提卷/还卷单上签字确认。5 电子化加工成果与档案管理信息系统接口在进行电子化加工的同时,按照档案管理信息系统的著录字段和信息,进行著录加工,并将加工和著录成果导入档案管理信息系统。系统的接口如下图所示:10EHVDA-04-5-2011