收藏 分销(赏)

T_BAS 009-2023 文物交易舆情数据采集规范.docx

上传人:Fis****915 文档编号:535415 上传时间:2023-11-22 格式:DOCX 页数:25 大小:64.51KB
下载 相关 举报
T_BAS 009-2023 文物交易舆情数据采集规范.docx_第1页
第1页 / 共25页
T_BAS 009-2023 文物交易舆情数据采集规范.docx_第2页
第2页 / 共25页
T_BAS 009-2023 文物交易舆情数据采集规范.docx_第3页
第3页 / 共25页
T_BAS 009-2023 文物交易舆情数据采集规范.docx_第4页
第4页 / 共25页
T_BAS 009-2023 文物交易舆情数据采集规范.docx_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、ICS 35.240.01 CCS L70团体标准T/BAS 009-2023文物交易舆情数据采集规范Data collecting specification for public opinion of cultural relics in public circulation trading2023-09-28 发布2023-09-28 实施北 京 标 准 化 协 会 发 布T/BAS 009-2023目次前言1 范围12 规范性引用文件13 术语和定义14 文物交易舆情数据采集范围15 舆情采集要素的表示格式16 舆情数据采集要素说明2 媒体数据源采集要素说明2 领域数据源采集要素说明1

2、3参考文献19图 1 文物交易舆情数据采集范围1III前 言本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本文件由北京标准化协会提出并归口。本文件起草单位:易元数字(北京)科技集团有限公司、北京易元数科文物艺术品产业发展研究院、浙江大学、中国科学院上海高等研究院、中国文物交流中心。本文件主要起草人:蒋齐琛、王中恕、王鹏、金东伟、李想、贺宜衡、赵磊、黄俊、谭平、陈昀、 李明君。T/BAS 009-2023文物交易舆情数据采集规范1 范围本文件规定了文物交易舆情数据采集的范围、采集要素的表示格式及采集要素说明。 本文件适用于文物流通领域文物交易监

3、测中的舆情数据采集。2 规范性引用文件本文件没有规范性引用文件。3 术语和定义下列术语和定义适用于本文件。舆情数据 public opinion data对民众在互联网产生的舆论情况,经过有组织、有目的地采集并经过加工而形成的数据。4 文物交易舆情数据采集范围文物交易舆情数据采集范围包含媒体数据源和领域数据源。媒体数据源采集的数据范围广泛,主要 为各大媒体、社交网络等信息源,领域数据源指文物交易领域的舆情信息源,主要为文物交易公司和文 物交易平台,文物交易舆情数据采集范围架构详见图1。根据媒体数据源和领域数据源中所包含的采集内容,扩展出相应的采集目标源。媒体数据源和领域 数据源共包含12类采集

4、目标源。媒体数据源根据媒体类型分为8类采集目标源:1) 新闻客户端2) 论坛3) 微信4) 微博5) 博客6) 视频7) 平媒8) 贴吧领域数据源根据文物交易公司和文物交易平台中包含的信息分为4类采集目标源:1) 交易文物信息2) 交易者信息3) 交易过程信息4) 交易金额信息5 舆情采集要素的表示格式本文件的文物交易舆情采集要素,应按照以下结构进行规范:名称:要素的中文名称,必填。说明:对要素的说明,非必填。数据类型:要素的取值类型,必填。是否必须:要素在采集时是否为必须要素,必填。示例:要素的实际示例,非必填。36 媒体数据源采集要素说明 新闻客户端要素6.1.1 新闻标题名称:新闻标题

5、数据类型:字符型是否必需:是6.1.2 新闻发布时间名称:新闻发布时间数据类型:日期型 是否必需:是示例:2022-09-15 15:46:126.1.3 新闻来源名称:新闻来源 数据类型:字符型是否必需:否6.1.4 新闻正文名称:新闻正文 数据类型:字符型是否必需:是6.1.5 新闻频道名称:新闻频道说明:新闻内容所属分类数据类型:字符型是否必需:否示例:经济6.1.6 新闻浏览量名称:新闻浏览量说明:用户打开新闻页面的次数数据类型:数字型是否必需:否6.1.7 新闻转发量名称:新闻转发量说明:用户转发新闻的次数数据类型:数字型是否必需:否6.1.8 新闻点赞量名称:新闻点赞量说明:用户点

6、赞新闻的次数数据类型:数字型是否必需:否6.1.9 新闻评论量T/BAS 009-2023名称:新闻评论量说明:用户评论新闻的次数数据类型:数字型是否必需:否6.1.10 新闻评论内容名称:新闻评论内容说明:用户评论新闻的内容数据类型:字符型是否必需:否6.1.11 新闻图片 URL名称:新闻图片URL说明:新闻中图片的URL 数据类型:字符型是否必需:否 论坛要素6.2.1 帖子标题名称:帖子标题 数据类型:字符型是否必需:是6.2.2 帖子发布时间名称:帖子发布时间数据类型:日期型 是否必需:是示例:2022-09-15 15:46:126.2.3 帖子正文名称:帖子正文 数据类型:字符型

7、是否必需:是6.2.4 帖子楼主名称:帖子楼主说明:指论坛中帖子的发布者数据类型:字符型是否必需:是6.2.5 帖子浏览量名称:帖子浏览量说明:用户打开帖子页面的次数数据类型:数字型是否必需:否6.2.6 帖子回贴量名称:帖子回贴量说明:用户回复帖子正文的次数4数据类型:数字型是否必需:否6.2.7 帖子收藏量名称:帖子收藏量说明:用户收藏帖子正文的次数数据类型:数字型是否必需:否6.2.8 帖子图片 URL名称:帖子图片URL说明:帖子中图片的URL 数据类型:字符型是否必需:否6.2.9 用户好友数名称:用户好友数说明:论坛某一用户与其他用户互相关注的数量 数据类型:数字型是否必需:否6.

8、2.10 用户主题数名称:用户主题数说明:论坛用户发布主题帖子的数量数据类型:数字型是否必需:否6.2.11 用户回帖数名称:用户回帖数说明:论坛用户回复帖子的数量数据类型:数字型是否必需:否 微信要素6.3.1 微信文章标题名称:微信文章标题数据类型:字符型 是否必需:是6.3.2 微信文章发布时间名称:微信文章发布时间数据类型:日期型是否必需:是示例:2022-09-15 15:46:126.3.3 微信文章来源名称:微信文章来源数据类型:字符型 是否必需:否T/BAS 009-20236.3.4 微信文章正文名称:微信文章正文数据类型:字符型 是否必需:是6.3.5 微信文章发布者名称:

9、微信文章发布者说明:指发布微信文章的人数据类型:字符型是否必需:是6.3.6 微信文章浏览量名称:微信文章浏览量说明:用户打开微信文章页面的次数数据类型:数字型是否必需:是6.3.7 微信文章点赞量名称:微信文章点赞量说明:点击微信文章“点赞”功能图标的用户数 数据类型:数字型是否必需:否6.3.8 微信文章“在看”量名称:微信文章“在看”量说明:点击微信文章“在看”功能图标的用户数 数据类型:数字型是否必需:否6.3.9 微信文章评论内容名称:微信文章评论内容说明:用户评论微信文章的内容数据类型:字符型是否必需:否6.3.10 微信公众号名称名称:微信公众号名称 说明:微信公众号的名称数据类

10、型:字符型是否必需:否6.3.11 微信公众号原创内容量名称:微信公众号原创内容量说明:微信公众号原创的文章数量数据类型:数字型是否必需:否6.3.12 微信图片 URL名称:微信图片URL6说明:微信文章中图片的URL 数据类型:字符型是否必需:否 微博要素6.4.1 微博正文名称:微博正文 数据类型:字符型是否必需:是6.4.2 微博发布时间名称:微博发布时间数据类型:日期型 是否必需:是示例:2022-09-15 15:46:126.4.3 微博发布者名称:微博发布者说明:指发布微博的用户昵称数据类型:字符型是否必需:是6.4.4 微博转发量名称:微博转发量说明:用户转发微博的次数数据类

11、型:数字型是否必需:否6.4.5 微博点赞量名称:微博点赞量说明:用户点赞微博的次数数据类型:数字型是否必需:否6.4.6 微博评论量名称:微博评论量说明:用户评论微博的次数数据类型:数字型是否必需:否6.4.7 微博转发量名称:微博转发量说明:用户转发微博的次数数据类型:数字型是否必需:否6.4.8 微博评论内容名称:微博评论内容说明:用户评论微博的内容T/BAS 009-2023数据类型:字符型是否必需:否6.4.9 微博标签名称:微博标签说明:微博所属的标签数据类型:字符型是否必需:否6.4.10 微博“超话”名称名称:微博“超话”名称数据类型:字符型是否必需:否6.4.11 微博“超话

12、”贴子数名称:微博“超话”贴子数说明:某一微博“超话”中帖子的数量数据类型:数字型是否必需:否6.4.12 微博“超话”签到数名称:微博“超话”签到数说明:某一微博“超话”中签到的用户数数据类型:数字型是否必需:否6.4.13 微博图片 URL名称:微博图片URL说明:微博中图片的URL 数据类型:字符型是否必需:否6.4.14 用户昵称名称:用户昵称说明:微博用户的名称数据类型:字符型是否必需:否6.4.15 用户粉丝数量名称:用户粉丝数量说明:微博用户粉丝的数量数据类型:数字型是否必需:否6.4.16 用户关注数量名称:用户关注数量说明:微博用户关注其他用户的数量数据类型:数字型是否必需:

13、否86.4.17 用户发布微博数量名称:用户发布微博数量说明:微博用户所发的全部微博数量数据类型:数字型是否必需:否6.4.18 用户转评赞量名称:用户转评赞量说明:用户得到的转发、评论、点赞的数量数据类型:数字型是否必需:否6.4.19 用户微博认证名称:用户微博认证说明:通过微博认可的账号类型数据类型:字符型是否必需:否 博客要素6.5.1 博客文章标题名称:博客文章标题数据类型:字符型 是否必需:是6.5.2 博客文章发布时间名称:博客文章发布时间数据类型:日期型是否必需:是示例:2022-09-15 15:46:126.5.3 博客文章正文名称:博客文章正文数据类型:字符型 是否必需:

14、是6.5.4 博客文章发布者名称:博客文章发布者说明:指发布博客文章的人数据类型:字符型是否必需:是6.5.5 博客文章浏览量名称:博客文章浏览量说明:用户打开博客文章页面阅读的次数数据类型:数字型是否必需:否6.5.6 博客文章转发量名称:博客文章转发量T/BAS 009-2023说明:用户转发博客文章的次数数据类型: 数字型是否必需:否6.5.7 博客文章点赞量名称:博客文章点赞量说明:用户点赞博客文章的次数数据类型: 数字型是否必需:否6.5.8 博客文章评论量名称:博客文章评论量说明:用户评论博客文章的次数数据类型:数字型是否必需:否6.5.9 博客文章评论内容名称:博客文章评论内容说

15、明:用户评论博客文章的内容数据类型:字符型是否必需:否6.5.10 博客文章标签名称:博客文章标签说明:博客文章所属的标签数据类型:字符型是否必需:否6.5.11 博客图片 URL名称:博客图片URL说明:博客文章中图片的URL 数据类型:字符型是否必需:否 视频要素6.6.1 视频标题名称:视频标题 数据类型:字符型是否必需:是6.6.2 视频发布时间名称:视频发布时间数据类型:日期型 是否必需:是示例:2022-09-15 15:46:126.6.3 视频内容 URL名称:视频内容URL 数据类型:字符型10是否必需:是6.6.4 视频发布者名称:视频发布者说明:指发布视频的人数据类型:字

16、符型是否必需:是6.6.5 视频播放量名称:视频播放量说明:用户播放视频页面的次数数据类型:数字型是否必需:否6.6.6 视频转发量名称:视频转发量说明:用户转发视频的次数数据类型:数字型是否必需:否6.6.7 视频点赞量名称:视频点赞量说明:用户点赞视频的次数数据类型:数字型是否必需:否6.6.8 视频收藏量名称:视频收藏量说明:用户收藏视频的次数数据类型:数字型是否必需:否6.6.9 视频评论量名称:视频评论量说明:用户评论视频的次数数据类型:数字型是否必需:否6.6.10 视频评论内容名称:视频评论内容说明:用户评论视频的内容数据类型:字符型是否必需:否6.6.11 视频弹幕名称:视频弹

17、幕说明:观看视频时弹出的评论性字幕内容数据类型:字符型是否必需:否T/BAS 009-2023 平媒要素6.7.1 平媒文章标题名称:平媒文章标题数据类型:字符型 是否必需:是6.7.2 平媒文章发布时间名称:平媒文章发布时间数据类型:日期型是否必需:是示例:2022-09-15 15:46:126.7.3 平媒文章来源名称:平媒文章来源数据类型:字符型 是否必需:是6.7.4 平媒文章正文名称:平媒文章正文数据类型:字符型 是否必需:是6.7.5 平媒文章评论量名称:平媒文章评论量说明:用户评论平媒文章的次数数据类型:数字型是否必需:是6.7.6 平媒文章评论内容名称:平媒文章评论内容说明:

18、用户评论平媒文章的内容数据类型:字符型是否必需:是6.7.7 平媒图片 URL名称:平媒图片URL说明:平媒文章中图片的URL 数据类型:字符型是否必需:否 贴吧要素6.8.1 贴吧名称名称:贴吧名称 数据类型:字符型是否必需:是6.8.2 贴吧关注量名称:贴吧关注量数据类型:数字型13是否必需:是6.8.3 贴吧贴子数名称:贴吧贴子数数据类型:数字型是否必需:是6.8.4 贴子标题名称:贴子标题 数据类型:字符型是否必需:是6.8.5 贴子发布时间名称:贴子发布时间数据类型:日期型 是否必需:是示例:2022-09-15 15:46:126.8.6 贴子正文名称:贴子正文 数据类型:字符型是

19、否必需:是6.8.7 帖子楼主名称:帖子楼主说明:指贴吧中帖子的发布者数据类型:字符型是否必需:是6.8.8 贴子回复量名称:贴子回复量说明:用户回复主题帖子的次数数据类型:数字型是否必需:否6.8.9 贴子评论量名称:贴子评论量说明:评论贴子正文的次数数据类型:数字型是否必需:否6.8.10 帖子图片 URL名称:帖子图片URL说明:帖子中图片的URL 数据类型:字符型是否必需:否6.8.11 用户吧龄名称:用户吧龄说明:贴吧用户注册贴吧的年数T/BAS 009-2023数据类型:数字型是否必需:否6.8.12 用户发帖量名称:用户发帖量说明:贴吧用户发帖的数量数据类型:数字型是否必需:否7

20、 领域数据源采集要素说明 交易文物要素7.1.1 文物名称名称:文物名称说明:文物的学术名称或其他名称数据类型:字符型是否必需:是示例:粉彩花鸟诗文撇口瓶7.1.2 Lot 号名称:Lot号说明:文物经文物局审核许可后的标的编号数据类型:数字型是否必需:是示例:7197.1.3 类别名称:类别说明:依据文物的时代、性质、功用、质地、艺术风格等特征对其划分的类别 数据类型:字符型是否必需:否示例:瓷器7.1.4 材质名称:材质说明:构成文物主体材料的物质成分数据类型:字符型是否必需:否示例:象牙7.1.5 尺寸名称:尺寸说明:文物相关部位经测量所得长、宽、高、口径、底径等数据 数据类型:字符型是

21、否必需:否示例:宽 11.5cm 高 22.9cm7.1.6 重量名称:重量说明:文物所含物质的量16数据类型:字符型是否必需:否示例:579.2 克7.1.7 品相名称:品相说明:对单件文物在某一特定时期的整体物理状况、特征和完整性的评估 数据类型:字符型是否必需:否示例:状况良好,轻微磨损、磕损和划痕7.1.8 年代名称:年代说明:与文物的创作相关的时间或时间区间数据类型:字符型是否必需:否示例:清7.1.9 作者名称:作者说明:参与文物创作、设计、制造或其他相关活动的人或机构 数据类型:字符型是否必需:否示例:李世民7.1.10 描述名称:描述说明:对文物艺术品的特征、功能、标记、风格、

22、主题等进行描述 数据类型:字符型是否必需:否示例:拍品罐式为唐代陶瓷经典造型,日本学者称其为“万年壶”。整器饱满浑圆,线条流畅婉约,施釉肆意洒脱, 彰显著鲜明的时代风貌。 罐圆唇撇口,直束颈,丰肩,胫部敛收出圆饼状平底,底边外侈。外壁三彩装饰,自口沿自然垂淌不及底,蓝、绿双色交融浸染,组合而成几何纹,黄彩热烈明朗,绿彩沉稳深邃。釉下见有白色浆水样化妆土, 器底涩胎,胎质为粉状感的细白陶胎,可见比较明显的修胎旋痕。唐代三彩罐虽较为多见,但本器于施彩及纹饰上皆为独特,风格别具,实属珍贵。相类器可见日本美术馆藏盛唐三彩山形文壶,于器型、纹饰皆为相似,可资比较。7.1.11 著录名称:著录说明:对文物

23、描述所创作的记录、文档、书籍 数据类型:字符型是否必需:否示例:徐氏艺术馆,徐氏艺术馆陶瓷I:新石器时代至辽代,香港,1993 年,页 1217.1.12 展览名称:展览说明:文物被公开展示的历史记录数据类型:字符型是否必需:否示例:New York, Eskenazi Ltd., Ceramic sculpture from Han and Tang China , 19 to 26 March 19977.1.13 估价T/BAS 009-2023名称:估价说明:根据拍卖活动的特定目的,价格评估人员运用科学的方法,依据法定的程序和标准,评定和 估算的拍卖标的某一时点的价格数据类型:字符型是

24、否必需:否示例:1,300,000 - 1,500,000 港币7.1.14 起拍价名称:起拍价说明:专业拍卖机构拍卖师报出的第口价数据类型:数字型是否必需:否7.1.15 买家佣金名称:买家佣金说明:买方为竞拍向代理机构支付的劳务费用 数据类型:字符型是否必需:否示例:20.00%7.1.16 图像 URL名称:图像URL说明:拍品标的的图像信息数据类型:字符型是否必需:否7.1.17 来源名称:说明:获得文物的来源单位或个人姓名数据类型:字符型是否必需:否示例:1.蓝理捷,纽约,编号 46532.北美十面灵璧山居收藏,购自蓝理捷,纽约,编号 LL1137.1.18 题识名称:题识说明:文物

25、上标记的文字数据类型:字符型是否必需:否示例:落英霜气重,零菊露华稀。旧苑生秋草,空怀金缕衣。心畬7.1.19 铭文名称:铭文说明:青铜器上铸造的文字数据类型:字符型是否必需:否示例:魚7.1.20 钤印名称:钤印18说明:文件或书画、书籍上面的印章符号数据类型:字符型是否必需:否示例:康有为印7.1.21 印文名称:印文说明:图章上或印迹上的文字数据类型:字符型是否必需:否示例:纪恩堂 交易者要素7.2.1 机构名称名称:机构名称说明:交易的机构名称数据类型:字符型是否必需:是7.2.2 成立时间名称:成立时间说明:交易机构的成立时间数据类型:日期型是否必需:否7.2.3 电话名称:电话说明

26、:交易机构的电话数据类型:字符型是否必需:否7.2.4 邮编名称:邮编说明:交易机构的邮编数据类型:数字型是否必需:否7.2.5 电子邮件名称:电子邮件说明:交易机构的电子邮件数据类型:字符型是否必需:否7.2.6 地址名称:地址说明:交易机构的地址数据类型:字符型是否必需:否 交易过程要素T/BAS 009-20237.3.1 拍卖会名称名称:拍卖会名称说明:交易的拍卖会名称数据类型:字符型是否必需:否示例:四海集珍-艺术品拍卖会7.3.2 专场名称名称:专场名称说明:交易的专场名称数据类型:字符型是否必需:否示例:中国古董珍玩专场7.3.3 拍卖时间名称:拍卖时间说明:交易机构举办拍卖会或

27、拍卖专场的开始时间 数据类型:日期型是否必需:否示例:2022 年 10 月 1 日 上午 9 点7.3.4 拍卖地点名称:拍卖地点说明:交易机构举办拍卖会或拍卖专场的地点 数据类型:字符型是否必需:否7.3.5 预展时间名称:预展时间说明:交易机构举办拍卖会或拍卖专场前的预展览时间 数据类型:日期型是否必需:否示例:2022 年 10 月 5 至 9 日7.3.6 预展地点名称:预展地点说明:交易机构举办拍卖会或拍卖专场前的预展览地点 数据类型:字符型是否必需:否 交易金额要素7.4.1 落槌价名称:落槌价说明:文物交易的落槌价格数据类型:数字型是否必需:否7.4.2 成交价名称:成交价20说明:文物交易的成交价格数据类型:数字型是否必需:否7.4.3 币种名称:币种说明:文物交易的币种数据类型:字符型是否必需:否T/BAS 009-2023参 考 文 献1 GB/T 22239-2008 信息安全技术 信息系统安全等级保护基本要求2 GB/T 31916.1-2015 信息技术 云数据存储和管理 第1部分:总则3 GB/T 5271.1-2000 信息技术 词汇 第1部分:基本术语4 GB/T35295-2017 信息技术 大数据 术语5 DB4401/T 122018 网络舆情分级与判定6 JR/T 02302021 债券价格指标产品数据采集规范19

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 行业资料 > 其他

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服