收藏 分销(赏)

FI分类号在智能检索系统中的应用.pdf

上传人:自信****多点 文档编号:850789 上传时间:2024-03-29 格式:PDF 页数:4 大小:1.46MB
下载 相关 举报
FI分类号在智能检索系统中的应用.pdf_第1页
第1页 / 共4页
FI分类号在智能检索系统中的应用.pdf_第2页
第2页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中国科技信息 2023 年第 19 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2023-36-专利分析关键词进行扩展结合的块检索模式构建检索式,则可能会出现关键词不好扩展或扩展后噪声很多的问题,同时还会涉及中英日三种语言之间的翻译问题。为此,本文介绍了在智能检索系统中使用 FI 分类号的检索方式,分析了如何充分结合智能检索中的相关功能提高利用 FI 分类号进行检索的效能,并通过实际案例以对检索实践进行指导。智能检索系统的检索方式智能检索系统在保留原 S 系统布尔检索命令的基础新增了语义检索相关的检索命令,语义检索基于大数据统计和机器学习模型,对

2、检索内容进行分析,提取检索信息,并用数学方法,将数据库每篇文献进行语义分词处理,提取关键词信息,智能算法将关键词信息向量化,向量值之间的余弦夹角表示两两文献之间的相似度,进行信息匹配,以寻求文本语义最相关文献。具体的,其可以采用案件申请号或者任何中英文的词句、段落作为语义基准进行检索,并且根据语义相关度对获取的文献进行排序。智能检索系统目前可以实现纯布尔、纯语义、先布尔后语义,先语义后布尔 4 种检索方式,但是纯布尔正如以前的S 系统的检索方式,需要精准的分类号和关键词,检索要求很高且容易漏检;纯语义,由于不同主体和案件对于相关信息的描述方式可能有较大差别,导致文献量和噪音非常大,信息匹配误差

3、较大时,也容易导致目标文献排序不在最大浏览量之内而漏检;先语义后布尔的方式融合了上述两种检索方式,理论上更符合纯语义的检索逻辑,在检索实践中更适宜与纯语义检索联合运用;而先布尔后语义的方式,融合了人工智慧和机器检索二者各自的优势,能够突破检索结果数量限制,先用简单的布尔检索大致锁定目标文献所在的范围,获得检索结果集,通过适当的“圈”,划定包含目标文献的范围,再通过合适的语义基准对检索结果集内的文献进行排序,使目标文献排序更靠前,从而很快锁定目标文献,更好地实现查全、查准,查快。FI分类号在智能检索系统中的应用本文以两个实际案例为分析对象,对 FI 分类号在智能检索系统中不同的检索方式所带来的影

4、响展开结论分析,验证在智能检索系统中推荐的检索方式。案例一 一种出风组件FI 分类号在智能检索系统中的应用庄 利 褚吉平 刘 帅庄 利 褚吉平(等同第一作者)刘 帅国家知识产权局专利局专利审查协作四川中心庄利(1991),山东济宁,硕士,助理研究员,研究方向:暖通空调领域专利审查;褚吉平(1985),甘肃山丹,硕士,助理研究员,研究方向:制冷领域专利审查;刘帅(1989),四川德阳,硕士,助理研究员,研究方向:锁具领域专利审查。IPC 分类侧重于对单一的技术主题进行分类,且技术分类相对粗糙,随着科学技术的迅速发展,技术复杂程度不断增加,各种技术之间的融合度不断提高,技术的细分领域研究也越来越精

5、细,当专利审查中涉及的专利文献量日益增加,若仅仅采用 IPC 分类体系,需要检索的专利文献可以达到几百甚至上千篇,检索效率低下,且检索结果准确度相对较低。为了方便归类文献和检索,日本特许厅专门建立了日本 FI/FT 专利分类体系。由于该分类体系是日本特许厅建立的,因此仅适用于日文专利文献的分类与检索。FI(File Index)分类体系是日本特许厅将 IPC 细分和扩展得到的,用于扩展 IPC 在某些技术领域的功能,其是以IPC 分类号为基础编制的。FI 分类号采用了类似 IPC 分类号的层次递降的等级结构原理对技术整体进行分割,使得在某一小组下的上千或上万的文献在细分/扩展之后,其文献数量限

6、制在几百或者几十篇文献之内,从而提高了检索效率。智能检索系统是在原S系统建设经验的基础上,按照“平台+模块”的总体建设思路,充分利用智能化技术,包括云计算、大数据分析、自然语言处理等前沿技术,搭建形成全新的基础架构平台,沿着检索资源集约化、检索功能智能化以及检索流程标准化的设计思路,建成的智能化的检索系统,其在功能上实现了语义检索、布尔检索多种检索功能的融合,支持中英文数据库的智能检索、智能检索基础上的布尔筛选以及布尔检索基础上的语义排序功能。目前,在智能检索系统中利用 FI 分类号进行检索时,由于要获取的目标文献是日文文献,如果依旧按照对分类号和-37-CHINA SCIENCE AND T

7、ECHNOLOGY INFORMATION Oct.2023中国科技信息 2023 年第 19 期专利分析待检索的权利要求 1:一种出风组件,具有第一出风状态和第二出风状态,包括框架(1)和多个导风板(2),多个导风板(2)的两端分别转动地固定在框架(1)上,处于框架(1)同侧的多个导风板(2)的端部分别与传动结构相连,通过对其中一个导风板(2)施加与出风口平面垂直的作用力,使出风组件在第一出风状态和第二出风状态之间切换。经分析可知,本案的发明构思是通过切换其中一个导风板在固定架内的位置,使得其他平行的导风板切换其在固定架的弧形孔内的位置,从而切换不同的出风状态。初审员给出的分类号为 F24F

8、13/15(有平行的可同时摆动的薄片的可动风门),在FI 分类表中可以查找到细分F24F13/15&B(带有多个水平配置的控制元件的风门),采用该分类号结合案件的申请日在 VCN 数据库中进行检索,具体检索式及检索结果如下:1 VCN 1931 f24f13/15&b/fi and pd20190907 在原 S 系统中,上述检索式获取的文献量太大,需要结合其他的检索要素将文献量缩限至合理范围内,再进行浏览筛选;但是在智能检索系统中,可以无需对其进行缩限,通过其默认的申请号作为语义排序基准,利用其提供的语义排序功能,按照与本案相似度由高到低的顺序对文献进行排序后显示,在概览的第 1 页第 2

9、位获取到对比文件JP2002293133A。对比文件公开了一种风向调节器,包括壳体和多个百叶板 22,多个百叶板 22 的两端分别转动地固定在壳体上,处于框架壳体同侧的多个百叶板 22 的端部分别与传动结构相连,通过对其中一个百叶板 22 施加与出风口平面垂直的作用力,切换其所在的位置,使得其他的百叶板 22 切换其在弧形孔内的位置,从而使得风向调节件在第一出风状态和第二出风状态之间切换。由此可知,该对比文件可以用于评价本案的新颖性。智能检索系统自动提供每个检索结果下的 400 篇文献进行浏览,对于上述检索式所获取的文献,如果不进行语义排序,该对比文件并不在其提供的400篇可直接浏览的文献中,

10、进行语义排序后,该文献则排在第 2 位。同时,在 WPABS 和 VEN 种采用相同的检索式进行检索,并利用语义进行排序,发现该对比文件在 WPABS 数据库中排在第 126 位,在 VEN 数据库的前 400 位文献中则不包含上述对比文件。由此可知,在英文数据库中利用 FI 分类号进行检索时,利用语义排序功能同样有助于快速获取对比文件;而对于在图 3 对比文件结构示意图图 1 第一种出风状态图 2 第二种出风状态图 4 VCN 中语义排序后的检索结果中国科技信息 2023 年第 19 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2023-38-

11、专利分析图 7 VEN 中语义排序后的检索结果图 6 WPABS 中语义排序后的检索结果不同数据库中对比文件的排序不同,分析原因可知,智能检索系统中的语义排序存在中文排序模型和英文排序模型,当语义排序基准为申请号时,语义排序基准为中文,当在英文数据库中进行检索时,系统会从DWPI 和 WPABS 数据库中提取相应的英文摘要,然后再进行语义检索,因而可能是由于翻译的不统一影响了文献的语义相关度,从而导致其在不同的数据库中排序有所不同,甚至会影响检索结果的显示。案例二 一种应用于新风机的新风机芯体待检索的权利要求:一种应用于新风机的新风机芯体,包括:热交换膜 101;用于检测热交换膜表面温度的温度

12、传感器;紧邻热交换膜设置用于提高热交换膜表面温度的热发生器;温度传感器和热发生器分别与设置有新风机芯体的新风机中的控制器相连接,用于根据设置在新风机中的温湿度传感器检测的新风进风温度、新风进风湿度得到当前露点温度并根据温度传感器检测的热交换膜表面温度和当前露点温度的大小控制热发生器开始加热或停止加热。经分析可知,本案的发明构思是根据露点温度与热交换器的表面温度,控制对新风机中的热交换器进行加热以提升热交换器表面的温度,防止热交换器表面凝露。根据本案的设备结构可知,内部的热交换膜实质上是一种在新风机中常用的全热交换器,即本案实质上涉及一种内部设置有全热交换器的新风机,在FI 分类表中可以查找到系

13、分 F24F1/0038&441(具有能量回收装置的新风换气装置),同时经核查可知,该分类号是在 2019 年 4 月更新后的新版分类号,其对应的旧版本的分类号为 F24F1/00&441,本案的申请日为 2019 年 9 月,与分类号的更新日期相近,因而为了防止漏检,同时采用上述两个分类号结合案件的申请日在 VCN 数据库中进行检索,具体检索式及检索结果如下:1 VCN 416 (f24f1/0038&441/fi or f24f1/00&441/fi)and pd20190909通过其默认的申请号作为语义排序基准,利用其提供的语义排序功能,按照与本案相似度由高到低的顺序对文献进行排序后显示

14、,在概览的第 1 页第 5 位获取到对比文件 JP2016169913A。对比文件公开了一种新风机,新风机 1 在框体12 中具备热交换器 2,热交换器 2 形成四棱柱状,以供气通路的方向与排气通路的方向正交的方式层叠多个供气通路和排气通路,在通过供气通路的供气与通过排气通路的排气之间进行热交换,供气通路呈由粘接于平板纸上的波板纸(波纹板)构成的多层构造(相当于包含有热交换膜),排气通路呈由粘接于平板纸上的波板纸(波纹板)构成的多层构造。利用温度传感器 13 检测热交换器表面的温度,在供气管道 14 的内部设置有加热器 16。为了防止热交换器 2 因室外空气所包含的水蒸气而结露、结霜、结冰,以

15、恒定的电力对室外空气进行加热。控制装置 11 将“温度传感器检测值”与“用于使加热器动作的阈值 Won”图 8 案例二结构示意图图 5 VCN 中无语义排序的检索结果-39-CHINA SCIENCE AND TECHNOLOGY INFORMATION Oct.2023中国科技信息 2023 年第 19 期专利分析图 9 对比文件结构示意图进行比较。“用于使加热器动作的阈值 Won”设为在热交换器 2 产生结露、结霜或结冰等的温度(相当于露点温度)。若比较的结果为“温度传感器检测值阈值Won”,则控制装置11使加热器16动作,若为“温度传感器检测值阈值 Won”,则维持加热器 16 的停止的

16、状态。在获取实时露点温度时,通过设置温湿度传感器实时检测的温度和湿度计算得到当前露点温度属于本领域的公知常识。由此可知,该对比文件可以与本领域的公知常识结合评价本案的创造性。同时,对于上述检索结果,如果不进行语义排序,该对比文件排在第 74 位,进行语义排序后,该文献则排在第 2 位。在 WPABS 和 VEN 种采用相同的检索式进行检索,并利用语义进行排序,发现该对比文件在WPABS 数据库中排在第 67 位,在 VEN 数据库中排在第 8 位。根据上述两个案例可知,在检索实践中,当利用 FI 分类号进行检索时,充分结合语义排序功能,有助于快速获取有效的对比文件;同时由于智能检索系统中的 J

17、PTXT 数据库不支持语义排序功能,因而建议首选在其他支持语义排序功能的数据库中进行检索。结语FI 分类号能够准确表达核心检索要素,且其在具体的细分下包含的文献量较少,对检索日文专利文献具有非常大的优势,因而合理高效利用 FI 分类号进行检索,有助于快速获取有效的日文文献。本文结合 FI 分类号的特点以及智能检索系统的相关功能模块,对不同的检索方式进行了分析比较,同时结合两个实际的检索案例,对 FI 分类号在智能检索系统中不同的检索方式所带来的影响进行了结论分析,建议在智能检索系统中利用 FI 分类号进行检索时充分结合语义排序功能,有助于提高检索效能。图 12 WPABS 中语义排序后的检索结果图 13 VEN 中语义排序后的检索结果图 10 VCN 中语义排序后的检索结果图 11 VCN 中无语义排序的检索结果

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服