收藏 分销(赏)

CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf

上传人:曲**** 文档编号:102728 上传时间:2022-07-29 格式:PDF 页数:24 大小:502.41KB
下载 相关 举报
CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf_第1页
第1页 / 共24页
CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf_第2页
第2页 / 共24页
CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf_第3页
第3页 / 共24页
CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf_第4页
第4页 / 共24页
CY∕T 143-2015 数据库出版物质量检测方法(新闻出版).pdf_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、ICS 01.140 L 67 CY 中 华 人 民 共 和 国 新 闻 出 版 行 业 标 准 CY/T 1432015 数据库出版物质量检测方法 Method for quality detection of database publication 2015 - 12 - 11 发布 2015 - 12 - 11 实施 中华人民共和国国家新闻出版广电总局 发 布 CY/T 1432015 I 目 次 前言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义、缩略语 . 1 3.1 术语和定义 . 1 3.2 缩略语 . 2 4 检测维度与要求 . 2 4.1 质量模

2、型 . 2 4.2 质量检测模型 . 3 4.3 质量要求 . 3 4.3.1 内容质量要求 . 3 4.3.2 出版质量要求 . 3 4.3.3 技术质量要求 . 4 5 检测原则与方法 . 5 5.1 检测原则 . 5 5.2 检测方法 . 5 5.2.1 抽检规则 . 5 5.2.2 检测方式 . 6 5.2.3 差错统计方法 . 6 5.3 检测程序 . 6 6 检测指标与质量等级 . 7 6.1 单项指标 . 7 6.2 综合指标 . 7 6.3 质量等级 . 7 附录 A(规范性附录) 语言文字规范依据表 . 9 附录 B(规范性附录) 质量检测模型与检测指标对照表 . 10 附录

3、 C(资料性附录) 单项指标与标度对照表 . 12 参考文献 . 14 CY/T 1432015 III 前 言 本标准按照GB/T 1.1-2009标准化工作导则 第1部分:标准的结构和编写给出的规则编制。 本标准由全国新闻出版信息标准化技术委员会提出并归口。 本标准起草单位:新闻出版总署信息中心、版信圆融(天津)科技有限公司、新闻出版总署出版产品质量监督检测中心。 本标准主要起草人:刘成勇、吴治强、张沫、吴毛利、陈楠、孙宝林、杨啸、王玉娟。 CY/T 1432015 1 数据库出版物质量检测方法 1 范围 本标准规定了数据库出版物质量检测维度与要求、检测原则与方法、检测指标与质量等级等。

4、本标准适用于书报刊的网络数据库出版物的质量检测。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。 凡是注日期的引用文件, 仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB 3100 国际单位制及其应用 GB 3101 有关量、单位和符号的一般原则 GB 3102 (所有部分) 量和单位 GB/T 15834 标点符号用法 GB/T 15835 出版物上数字用法 GB/T 16159 汉语拼音正词法基本规则 CY/T 103-2014 数据库出版物质量评价规范 GF 1001 第一批异形词整理表 3 术语和定义、缩略语 GB/T

5、22373-2008、CY/T 50-2008、CY/T 101.1-2014和CY/T 103-2014确立的以及下列术语和定义适用于本文件。 3.1 术语和定义 3.1.1 数据库 database 按一定逻辑组织的信息或事实数据的集合。 CY/T 103-2014,定义2.1 3.1.2 数据库出版物 database publication 以数据库为内容,提供一种或多种查寻途径以方便用户定位并访问数据库内容的大众传播媒体。 CY/T 103-2014,定义2.2 3.1.3 数据库出版 database publishing 数据库出版物的生产与服务过程。 CY/T 1432015

6、2 CY/T 103-2014,定义2.3 3.1.4 元数据 metadata 定义和描述其他数据的数据。 GB/T 22373-2008,定义3.3 3.1.5 全文 full text 出版物正文部分的全部文字。 CY/T 101.1-2014,定义4.2.21 3.1.6 文本型全文数据 full text data of text type 通过格式命令控制以文本、表格、图形、图片及公式为显示样式的文献数字对象的全文数据。 3.1.7 图像型全文数据 full text data of image type 以图像方式保存和显示文献全部内容的文献数字对象的全文数据。 3.1.8 灰度

7、图 grey scale image 灰阶图 将白色与黑色之间按对数关系分为若干等级的图像。 CY/T 101.1-2014,定义5.2.7 3.1.9 图像分辨率 praphic resolution 图像的精度,单位尺寸内呈现像素的数量。 CY/T 101.1-2014,定义5.2.6 3.1.10 空链接 null link 未指派的链接。 3.2 缩略语 DPI:每英寸的像素(Dot Per Inch) 4 检测维度与要求 4.1 质量模型 数据库出版物质量模型应符合CY/T 103-2014中的3.1的规定。 CY/T 1432015 3 4.2 质量检测模型 数据库出版物的质量检测

8、主要针对数据库出版物的内容进行检测, 检测模型包括数据库出版物的内容质量、出版质量和技术质量三个维度,每个维度所包含的检测指标见图1: 数据库出版物质量检测模型内容质量出版质量技术质量 合法性 准确性 完整性 时效性 价值性 语言文字规范 版本信息 编排规范 标引质量 加工质量 持续更新 功能 性能 图 1 数据库出版物质量检测模型 4.3 质量要求 4.3.1 内容质量要求 4.3.1.1 合法性 数据库出版物内容应遵守国家有关的法律法规和部门规章的规定。 4.3.1.2 准确性 数据库出版物内容来源的可靠性、内容描述应与特定主题相关。 4.3.1.3 完整性 数据库出版物应包含所有内容要素

9、,对出版物主题进行全面、完整的描述。从内容覆盖度及条目内容的完整度的测度进行检测。 4.3.1.4 时效性 数据库出版物应及时有效地收录相关内容, 满足行业特征或用户需求。 通过内容滞后期的测度对数据库出版物的时效性进行判定。 4.3.1.5 价值性 数据库出版物内容应提供对用户有价值的信息, 对用户的实践活动产生积极促进作用。 从内容来源的权威性和市场需求度的测度进行检测。 4.3.2 出版质量要求 4.3.2.1 语言文字规范 数据库出版物中的语言文字应符合附录 A 的规定,数据库出版物的内容差错率计算方法见式(1)。 CY/T 1432015 4 %100=数据库中全部正文内容正文内容的

10、错误数内容差错率(1) 4.3.2.2 版本信息 出版单位应在出版物的明显位置标示版本信息。 版本信息包含出版物名称、 作者、 主编、 出版单位、出版单位地址、版本号和发布日期等。 4.3.2.3 编排规范 数据库出版物的整版编排规范应符合以下5点要求: a) 行间距、字间距、字体大小应统一; b) 不应出现缺页、多页、错页、重页现象; c) 不应出现版面重叠; d) 内容重复; e) 版面差错率的计算方法见式(2)。 %100=版面总数错误版面数版面差错率(2) 4.3.2.4 标引质量 检测数据库中的元数据项,包含关键词、主题分类及元数据项标识符等项的标引质量。元数据项未被标引、标引错误、

11、标引项不一致等都应计为标引错误,标引差错率的计算方法见式(3)。 %100=元数据项总量据项数量元数据项标引错误的数标引差错率(3) 4.3.2.5 加工质量 4.3.2.5.1 文本型全文数据 文本型全文数据主要检测版面差错率。 4.3.2.5.2 图像型全文数据 图像型全文数据主要检测文字和灰度图像分辨率、 彩色图像分辨率及版面差错率。 图像型全文数据的版面差错率与文本型全文数据的版面差错率要求一致且页面无污损。 4.3.2.6 持续更新 出版单位应持续丰富和完善数据库出版物的内容。 4.3.3 技术质量要求 4.3.3.1 功能检测指标 数据库出版物的功能应从以下 7 方面进行检测: a

12、) 导航:导航功能的设置应合理,使用时准确、便捷; b) 查全率:查全率的计算方法见式(4); CY/T 1432015 5 %100=数据库中相关作品总量检出相关作品数量查全率(4) c) 查准率:查准率的计算方法见式(5); %100=检出的全部作品篇数检出相关作品篇数查准率(5) d) 内链接功能: 检测内链接的差错率, 不应出现跳转后页面内容与链接地址不匹配和空链接的错误,计算方法见式(6); %100=数据库中内链接项总数错误的内链接项数内链接差错率(6) e) 图像的显示:图像文件应页面整洁、清晰且页面整体倾斜不能超过 3; f) 音频的播放:出版物中应支持音频的正常播放; g)

13、视频的播放:出版物中应支持视频的正常播放。 4.3.3.2 性能检测指标 数据库出版物性能应从以下 4 方面进行检测: a) 页面跳转的平均响应时间; b) 单页面文本型数据的平均加载时间; c) 单页面图像型数据的平均加载时间; d) 文献的平均下载时间。 注1:检测时宜考虑实际检测时的网络环境及文件大小。 注2:检测单位检测异地的数据库服务器时,宜适当放宽性能指标项要求。 5 检测原则与方法 5.1 检测原则 数据库出版物的质量判定应符合以下4项原则: a) 公平、公正; b) 兼顾社会效益和经济效益; c) 遵循有关国家标准、国际标准、行业标准及相关技术规范; d) 适用于不同种类书报刊

14、的网络数据库出版物。 5.2 检测方法 5.2.1 抽检规则 5.2.1.1 内容质量的抽检规则 正文部分的抽查内容应不少于50万字。数据库出版物的字数不足50万字,检查全部正文内容。 注:出版质量中语言文字规范的抽检规则与内容质量的抽检规则相同。 5.2.1.2 出版质量及技术质量的抽检规则 CY/T 1432015 6 出版质量和技术质量应以篇、章、节等单位为检测标准单位,抽样检测范围应不低于检测标准单位的20倍。 5.2.2 检测方式 5.2.2.1 专家检测 由数据库和出版领域的专家从专业性角度对数据库出版物进行检测,检测指标项的指标标度值参见附录 C。 5.2.2.2 技术检测 检测

15、单位应使用检测软件并提供与数据库直接交互的中间件。检测指标项的指标标度值参见附录 C。 数据库出版物的出版单位应为检测单位提供相应的检测环境,包括数据库类型、检测账号等信息。 5.2.3 差错统计方法 a) 正文内容差错率的统计方法应符合图书编校质量差错认定细则; b) 元数据项未被标引、标引错误、标引不一致等每处按1个差错计算; c) 用户使用内链接功能时,页面跳转错误的每处按1个差错计算; d) 版面内容不符合编排规范要求的每处按 1 个差错计算。 5.3 检测程序 质量检测程序如图 2 所示,程序说明如下: a) 检测单位选择被检测的数据库出版物; b) 确定检测的指标项; c) 按照抽

16、检规则进行抽检; d) 通过专家和软件的检测,给出打分结果和结论; e) 出具检测报告。 CY/T 1432015 7 专家检测技术检测(软件检测)出具检测报告抽检选择数据库出版物确定检测指标项 图 2 检测程序 6 检测指标与质量等级 6.1 单项指标 单项指标分为必选、可选及有则必选三种,质量检测模型与检测指标对照表见附录 B。 检测指标采用打分制,对指标进行测度时给出具体分值,分值表见表 1。 表 1 分值标度表 序号序号 分值分值 评分要求评分要求 1 5 分 检测结果优于指标要求 2 4 分 检测结果符合指标要求 3 3 分 检测结果基本符合指标要求 4 1-2 分 检测结果部分符合

17、指标要求 5 0 分 检测结果不符合指标要求 6.2 综合指标 综合指标项根据单项指标进行计算,计算全部被检测单项指标的算术平均值。 6.3 质量等级 质量等级依据单项指标得分和综合指标得分分值情况划分为合格、 不合格, 对应分值要求如下: a) 合格:必选单项指标每项高于或等于 3 分,且综合指标得分高于或等于 3 分; CY/T 1432015 8 b) 不合格:必选指标项中任一项低于 3 分,或综合指标得分低于 3 分。 CY/T 1432015 9 附 录 A (规范性附录) 语言文字规范依据表 语言文字规范依据表见表A.1。 表A.1 语言文字规范依据表 检测指标检测指标 标准及规范

18、标准及规范 语语 言言 文文 字字 规规 范范 中华人民共和国国家通用语言文字法 现代汉语通用字表 新旧字形对照表 GB 3100 GB 3101 GB 3102 GB/T 15834 GB/T 15835 GB/T 16159 GF 1001 CY/T 1432015 10 附 录 B (规范性附录) 质量检测模型与检测指标对照表 质量检测模型与检测指标对照表见表B.1。 表 B.1 质量检测模型与检测指标对照表 检测项目检测项目 检测检测指标指标 指标指标类型类型 检测检测形式形式 内容质量 合法性 必选 专家检测 准确性 内容来源可靠性 可选 专家检测 内容描述准确性 可选 专家检测 完

19、整性 内容要素完整性 可选 专家检测 内容覆盖度 可选 专家检测 条目内容的完整度 可选 专家检测 时效性 滞后度 可选 专家检测 价值性 内容来源的权威性 可选 专家检测 市场需求度 可选 技术检测 出版质量 语言文字规范 内容差错率 必选 专家检测 版本信息 出版物名称 必选 专家检测 出版单位 必选 专家检测 出版单位地址 必选 专家检测 版本号 必选 专家检测 发布日期 有则必选 专家检测 作者 有则必选 专家检测 主编 有则必选 专家检测 责任编辑 有则必选 专家检测 主管单位 有则必选 专家检测 主办单位 有则必选 专家检测 书刊出版营业许可证的号码 有则必选 专家检测 统一书号

20、有则必选 专家检测 期刊编号 有则必选 专家检测 国内统一连续出版物号 有则必选 专家检测 国际标准连续出版物号 有则必选 专家检测 刊期 有则必选 专家检测 编排规范 版面差错率 必选 专家检测 标引质量 关键词的标引差错率 可选 技术检测 主题分类的标引差错率 可选 技术检测 元数据标识符的标引差可选 技术检测 CY/T 1432015 11 错率 加工质量 文本型全文数据的版面差错率 必选 技术检测 图像型全文数据的文字和灰度图像分辨率 可选 技术检测 图像型全文数据的彩色图像分辨率 可选 技术检测 图像型全文数据的版面差错率 有则必选 技术检测 持续更新 可选 技术检测 技术质量 功能

21、 导航功能 可选 专家检测 查全率 必选 技术检测 查准率 必选 技术检测 内链接差错率 有则必选 技术检测 图像 有则必选 技术检测 音频 有则必选 技术检测 视频 有则必选 技术检测 性能 页面跳转的平均响应时间 有则必选 技术检测 单页面文本型数据的平均加载时间 可选 技术检测 单页面图像型数据的平均加载时间 可选 技术检测 文献下载的平均下载时间 可选 技术检测 CY/T 1432015 12 附 录 C (资料性附录) 单项指标与标度对照表 单项指标与标度对照表见表C.1。 表 C.1 单项指标与标度对照表 单项指标单项指标 指标标度指标标度 合法性 100% 准确性 内容来源可靠性

22、 90% 内容描述准确性 90% 完整性 内容要素完整性 85% 内容覆盖度 90% 条目内容的完整度 90% 时效性 滞后度 6 个月 价值性 内容来源的权威性 99% 市场需求度 90% 语言文字规范 内容差错率 0.04 版本信息 出版物名称 必备 出版单位 必备 出版单位地址 必备 版本号 必备 发布日期 有则必备 作者 有则必备 主编 有则必备 责任编辑 有则必备 主管单位 有则必备 主办单位 有则必备 书刊出版营业许可证的号码 有则必备 统一书号 有则必备 期刊编号 有则必备 国内统一连续出版物号 有则必备 国际标准连续出版物号 有则必备 刊期 有则必备 编排规范 版面差错率 0.

23、03% 标引质量 关键词的标引差错率 0.03% 主题分类的标引差错率 0.03% 元数据标识符的标引差错率 0.03% 加工质量 文本型全文数据的版面差错率 0.05% CY/T 1432015 13 图像型全文数据的文字和灰度图像分辨率 72dpi 图像型全文数据的彩色图像分辨率 72dpi 图像型全文数据的版面差错率 0.05% 持续更新 1个月 功能 导航功能 80% 查全率 85% 查准率 80% 内链接差错率 0.3% 图像 显示正常 音频 播放正常 视频 播放正常 性能 页面跳转的平均响应时间 5s 单页面文本型数据的平均加载时间 5s 单页面图像型数据的平均加载时间 7s 文献下载的平均下载时间 20s CY/T 1432015 14 参 考 文 献 1 GB/T 18359-2009 中小学教科书用纸、印刷质量要求和检验方法. 2 CY/T 58.4-2009 MPR出版物 第4部分:MPR码印制质量要求及检验方法. 3 花芳.文献检索与利用.北京:清华大学出版社,2009. 4 蒋歆.分类标引质量现状和改善措施.长江大学.2006.http:/ 5 陈光英,张千里,李星.异常检测中查全率和查准率的控制.清华大学.2004. http:/ 6 康微.网上图书馆导航体系评价.南京大学.http:/ _

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 通信科技 > 数据库/数据算法

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服