收藏 分销(赏)

一种可自定义词库的术语录入、查询与标注系统的建立.pdf

上传人:自信****多点 文档编号:2500453 上传时间:2024-05-30 格式:PDF 页数:5 大小:2.24MB
下载 相关 举报
一种可自定义词库的术语录入、查询与标注系统的建立.pdf_第1页
第1页 / 共5页
一种可自定义词库的术语录入、查询与标注系统的建立.pdf_第2页
第2页 / 共5页
一种可自定义词库的术语录入、查询与标注系统的建立.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、技 术 方 法一种可自定义词库的术语录入、查询与标注系统的建立李 杰1 李瑞瑞2(1.中国科技出版传媒股份有限公司,北京 100009;2.重庆科技大学法政与经贸学院,重庆 401331)摘 要:术语的统一与规范使用在科研论文和学术图书的写作、翻译、编辑、校对以及审阅等过程中具有重要意义。为了在Word 本地文档中实现术语快捷录入、模糊查询和免费、批量自动标注,系统利用 Excel 工作簿存储自定义词库,利用表单控件和 VBA 代码实现术语录入,利用动态数组函数 FILTER 实现术语查询,利用 VBA 代码实现 Excel 与 Word 联动并对文档批量添加批注。可以在该系统中实现词库的自主

2、管理,在无须安装其他软件或联网的条件下实现词库便捷录入、术语即时查询和对本地文档进行批量自动标注,适合在写作、翻译、编辑、校对、审阅等多种场景下使用。得益于 Excel 软件的普及性,该系统具有较强通用性,能够在多种场景下提高术语统一工作的效率。同时文章也指出了系统存在的不足之处。关键词:自定义词库;术语录入;术语查询;术语标注;Excel VBA中图分类号:N04 文献标识码:A DOI:10.12339/j.issn.1673-8578.2024.02.008A New System of Term Entry,Query and Labeling with a Self-defined

3、Term Base/LI Jie,LI RuiruiAbstract:The consistent and standardized use of terms is of great significance in writing,translation,editing,proofreading,and re-view of scientific research papers and academic books.To achieve fast entry of terms,fuzzy query,and free and automatic annotation in local docu

4、ments,the study designs a new system of term entry,query and labeling with a self-defined term base,which has the fol-lowing functions:store self-defined terms with Excel workbooks,enter terms with form controls and VBA code,search terms with dy-namic array function FILTER,and link Excel and Word wi

5、th VBA code to achieve batch annotation of terms in documents.This sys-tem has a self-defined term base and allows for convenient entry of terms,instant querying of terms,and batch automatic annotation of local documents without additional software or internet connection.It is suitable for use in va

6、rious scenarios such as writing,transla-tion,editing,proofreading,and review.Keywords:self-defined term base;term entry;term query;term labeling;Excel VBA收稿日期:2023-10-16 修回日期:2024-01-24 术语的统一和规范化对于科学知识的传播与交流1、科技成果的推广2、书刊的编辑出版与质检3-4、语言文字翻译5都十分重要6-7。术语使用前后不一致的情况包括同一概念存在多个术语表达、术语的错误使用等。这些现象的产生原因既包括同一作品

7、的多位作者没有做到术语统一8,也包括同一位作者、译者或编辑未能使用相同术语。便捷的术语查询与标注软件可以很好地解决术语不统一的问题。以欧路词典、灵格斯词典、有道词典为代表的词典类软件可以实现便捷查询,并且有些(如欧路词典)可以实现录入术语的自主管理,但它们无法实现术语标注,只能现用现查。以Google 翻译、有道翻译、Bing 翻译为代表的机器翻译软件或网站虽能够实现便捷查询,却无法实现词库自主管理或术语标注。以 SDL Trados、云译客为代表的机器辅助翻译软件以及以语帆术语宝为代表的术语管理系统9-10虽可以实现便捷查询、术语标注及词库自主管理,但通常需要付费、安装特定客户端和联网使用。

8、本项研究旨在利用启用宏的Excel 文件,设计一款可自定义词库的术语录入、查询与标注系统,以实现词库的自主管理,并实时展示查询结果,无须安装其他软件就可以免费实现对95中国科技术语/2024 年 第 26 卷 第 2 期Word 文档的术语标注。1 整体架构本系统的架构主要包括 3 个前台功能模块和 1个后台存储模块(如图 1)。其中,3 个前台功能模块为术语录入模块、术语查询模块和术语标注模块。图 1 系统整体架构2 系统功能与特点2.1 系统功能本系统在设计时旨在实现以下 3 方面的功能。(1)便捷的术语录入方式。使用 Excel 管理术语通常需要使用者直接对术语所在工作表进行增添、删除、

9、修改,而本系统利用文本框、组合框和按钮等表单控件为使用者创建了专门的术语录入区域,避免直接对词库进行操作可能引发的意外错误。(2)即时显示术语查询结果。多数术语查询软件或网站在搜索时的操作都是输入查询内容,点击“查询”或“搜索”按钮后才能显示结果。此系统中,用户通过在文本框中输入需要查询的术语,进而利用单元格获取文本框数据,然后再利用 FIL-TER 公式,可以直接显示查询到的结果,在使用者每输入一个字符时,查询结果就会随之改变一次,输入完毕时就可以直接显示结果,无须输入完毕后的额外操作。(3)选择特定属性的术语对本地文档以批注方式进行术语标注。该系统中的每条术语均具有“内容类别”与“语言类别

10、”属性,这两个属性是术语标注时的识别属性。系统根据用户选择的两个属性扫描词库中的术语,并对所选文档中出现此属性术语的字符添加批注。2.2 系统特点本系统具有以下特点:(1)词库管理方便快捷,查重规则自由定义。本系统可以通过“前台”工作表中的表单控件录入术语;同时,使用者可以直接对“后台”工作表中的术语条目进行增添、删除、排序等操作。在使用者录入术语的同时,可以实现“后台”工作表中术语条目的自动查重,并且可以很方便地修改查重规则,如仅删除原语重复条目,删除原语与目标语同时重复的条目,或者删除原语、目标语、内容类别和语言类别中同时重复的条目等,使用者仅须修改少量 VBA 代码即可改变词库查重规则,

11、方便词库管理。(2)查询结果实时展示,支持使用通配符号。进行术语查询时,使用者在输入原语的过程中,该系统会利用 Microsoft Office 365 动态数组公式的自动溢出功能实时展示查询结果,同时支持通配符“”“?”(二者均为半角状态),实现模糊查询。(3)支持术语自动标注,无须安装其他软件。本系统可以实现对 MS Word 文档的术语标注,无须安装其他软件或插件,只要电脑安装了 MS Word 与MS Excel 软件并且开启宏功能即可使用。(4)内容和语言都具有两种分类,使用场景多种多样。本系统的词库管理对于每个词条设置了内容类别和语言类别两种属性,目的是合理、精准地对术语进行分类,

12、并且在术语标注时缩小需要扫描的术语范围,从而提高运行效率。如术语的“内容类别”可以显示术语的内容、学科、来源等属性;而“语言类别”则显示了术语的语言属性,如翻译、注音、释义等。因此,该系统不仅能应用在任何两种语言的翻译场景中,还可以应用于汉字注音(中文拼音)、错别字标注(错别字正确字)、术语解释(术语解释说明)等多种场景中。(5)鼠标操作便捷高效,避免重复键盘操作。在术语查询时,系统取消设置“查询”按钮,使用者在输入过程结束时就能直接获得查询结果,节省了点击操作。06技 术 方 法3 功能实现系统界面主要由前台与后台 2 个工作表组成。其中,前台工作表主要用于录入术语、查询术语以及术语标注;后

13、台工作表用于保存录入的术语,并为前台查询提供数据。3.1 术语录入术语录入区位于“前台”工作表(如图 2)。其中,A 与 B 区域由文本框构成,用于输入原语和目标语;C 与 D 区域由组合框构成,用于输入或者从已有的词库中读取内容类别和语言类别。“存档”按钮用于将术语输入区 2 个文本框与 2 个组合框中所输入的信息保存在“后台”工作表中,并完成“后台”工作表中所有术语的查重与按照原语字符数由多到少排序。“清空”按钮用于清空术语输入区 2 个文本框与2 个组合框中的内容,便于重新录入。图 2“前台”工作表的术语输入区“后台”工作表用来存放自定义词库。该工作表包含 7 列数据 “原语”“目标语”

14、“内容类别”“语言类别”“录入日期”“原语字符数”“目标语字符数”。该工作表可以直接编辑,也可以接收用户在“前台”工作表中点击“存档”时录入的术语。在接收“前台”工作表的存档时,A D 列数据均来自“前台”工作表的术语输入区,EG 列数据由程序自动计算生成,均无须手动填写,如图 3 所示。3.2 术语查询术语查询与术语录入共用“前台”工作表的术图 3“后台”工作表语输入区,使用者在“原语”文本框中输入需要查询的术语,在右侧结果显示区将实时显示查询结果。输入的术语可以包含通配符,查询结果在输入每个字符后会即时刷新。利用 MS Excel 365 版本的最新公式“Filter”即可实现筛选内容即时

15、呈现。3.3 术语标注术语标注功能建立在一个新的窗体中,点击“前台工作表”的“术语标注”按钮即可显示,如图 4。使用者在 A 区选择需要标注的文档路径,在 B 区选择内容类别(支持多选,并显示所选项目数量),在 C 区选择语言类别(仅支持单选,在 D 区点击“开始标注”按钮,即可对所选文档进行术语标注。图 4“术语标注”窗体4 操作示例4.1 术语录入使用者在“前台”工作表“术语输入区”的“原16中国科技术语/2024 年 第 26 卷 第 2 期语”文本框、“目标语”文本框、“内容类别”组合框与“语言类别”组合框中输入或选择录入的内容(文本框需要输入内容,组合框可以输入新内容或者选择已有内容

16、),并点击录入按钮。如录入原语“伤寒论”、目标语“张仲景”、内容类别“典籍作者姓名”、语言类别“汉语汉语”,点击“存档”按钮,即可将该条术语录入到“后台”工作表中,如图 5。图 5 术语录入示例4.2 术语查询以查询“伤寒论”和“伤寒杂病论”为例。包含通配符的查询方式为“伤寒论”,其查询结果见图 6;不包含通配符的查询方式为“伤寒论”,其查询结果见图 7;在“伤寒论”这 3 个字符依次输入的过程中,查询结果会即时改变,见图 8。图 6 包含通配符的“伤寒论”查询结果图 7 不包含通配符的“伤寒论”查询结果4.3 术语标注以“术语标注示例.docx”文档为例,选择“内容类别”3 项、“语言类别”

17、1 项,然后点击“开始标注”图 8“伤寒论”动态查询结果备注:A 图:输入“伤”时的显示结果;B 图:输入“伤寒”时的显示结果;C 图:输入“伤寒论”时的显示结果。(如图 9),等待标注完成。完成标注的文档将会保存在与被标注文本相同的文件夹下,标注结果如图 10。图 9 术语标注设置26技 术 方 法图 10 术语标注结果5 结语本系统以常用的 Excel 工作簿为载体,实现了自定义词库的术语录入、查询与标注,可广泛用于写作、翻译、编辑、校对、批阅等工作中。得益于 Excel软件的普及性,使得该系统具有较强的通用性,能够在多种场景下提高术语统一工作的效率。该系统存在的不足之处,主要是当系统词库

18、的数量较大且需要标注的文本中存在大量需要标注的术语时,该系统标注的效率有所降低,且随着系统词库数量和需要标注的文本中术语数量的增加呈正相关。该不足之处在其他术语标注软件中也存在。加强该系统词库的精细化管理,对词库中每个条目的属性做好分类,使得术语标注时所选择的词库属性与需要标注的文本属性最为接近,将能够尽量减少该属性条目的扫描时间,最大限度地缩减术语标注的运行时间,提高运行效率。参考文献1 张英禾,肖卫雯.医学期刊中骨科名词术语使用存在的问题及规范化建议J.编辑学报,2023,35(3):279-283.2 郑钧正.必须高度重视医学名词术语规范化J.医学研究杂志,2022,51(2):4,5-

19、7.3 吴洋意.医学期刊专题来稿中专业术语不统一的原因分析及处理策略J.编辑学报,2012,24(6):549-551.4 国家新闻出版署.图书编校质量差错判定和计算方法:CY/T 2662023S.2023.5 MONTERO MARTNEZ S,FABER BENTEZ P.Termi-nological competence in translation J.Terminology,2009,15(1):88-104.6 吕海亮,傅游.科技名词规范化表达的要求及意义:以工程爆破论文为例J.编辑学报,2020,32(5):513-517.7 科技名词术语的统一和规范化的意义J.中国现代医药

20、杂志,2022,24(1):60.8 王华树,郝冠清.现代翻译协作中的术语管理技术J.中国科技翻译,2016,29(1):18-21.9 王华树,王少爽.翻译场景下的术语管理:流程、工具与趋势J.中国科技术语,2019,21(3):9-14.10 王华树,张政.面向翻译的术语管理系统研究J.中国科技翻译,2014,27(1):20-23.作者简介:李杰(1987),男,硕士,中国科技出版传媒股份有限公司中医药分社策划编辑。研究方向为中医药类书刊数字化编辑与出版。在国内外期刊上发表过中医药学方面的论文。通信方式:lijiezyy 。李瑞瑞(1991),女,重庆科技大学法政与经贸学院硕士在读。研究方向为数字化编辑与出版研究。通信方式:1092937568 。36

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服