1、中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 7 郑 影,常 春.基于 Lotka-Volterra 捕食者-猎物模型的概念间相关关系研究J.中华医学图书情报杂志,2022,31(12):7-13.DOI:10.3969/j.issn.1671-3982.2022.12.002 研究与探讨 基于 Lotka-Volterra 捕食者猎物模型的概念间相关关系研究 郑 影,常 春 摘要目的:相关关系是叙词表中一种重要的概念关系。对具有相关关系的概念间属性进行研究,对叙词表相
2、关关系的构建和更新维护有重要意义。方法:假设具有“捕食”关系的概念数量变化符合生态学中 Lotka-Volterra 捕食者-猎物模型,以农业领域中一个主题概念为起点,获取相关关系概念网络,在对各组相关关系进行判断之后,在中国知网(CNKI)中获取各个概念 2000-2021 年历年文献量,使用 SPSS 软件对数据进行统计分析。结果:80%具有“捕食”关系的概念符合Lotka-Volterra 捕食者-猎物模型。结论:可通过概念间词频的关系来为叙词表的编制和维护工作提供参考建议。关键词Lotka-Volterra 模型;捕食关系;叙词表;概念;词频 中图分类号G254.2;G254.0 文献
3、标志码A 文章编号1671-3982(2022)12-0007-07 Research on associative relationship of concepts based on Lotka-Volterra Predator-Prey Model ZHENG Ying,CHANG Chun Research on associative relationship of concepts based on Lotka-Volterra Predator-Prey Model ZHENG Ying,CHANG Chun(Institute of Scientific and Technic
4、al Information of China,Beijing 100038,China)Corresponding author:CHANG Chun AbstractAbstract ObjectiveObjective The associative relationship plays a key role in thesaurus,and the research on the attributes of concepts with associative relationship is of great significance to the construction,updati
5、ng and maintenance of associative relationship in thesaurus.Methods Methods Assuming that the variation in the number of concepts with predator relationship fit the Lotka-Volterra predator-prey model in ecology,the concept network of associative relationship was obtained starting from a topic concep
6、t in the agricultural field.After the associative relationship of each group was determined,the literature volume of each concept from 2000 to 2021 was obtained from CNKI,and the data were statistically analyzed by SPSS software.ResultsResults 80%of the concepts with“predator”relationship fit the Lo
7、tka-Volterra predator-prey model.Conclusion Conclusion The relationship of word frequency between concepts can provide a reference for the compilation and maintenance of thesaurus.Key wordsKey words Lotka-volterra model;Predator-prey relationship;Thesaurus;Concept;Word frequency 叙词表又称为主题词表,是将自然语言转换为
8、规范语言的一种受控的结构化词表,它概括了各门或某一学科领域知识,并由术语表达的概念及语义关系构成1;在文献标引与情报检索过程中,它是一种用以将文献、标引人员及用户的自然语言转换为统一的系统语言的术语控制工具2。相关关系的构建在叙词表编制过程中至关重要,由于相关关系的复杂性和模糊性,研究者寻求各种方法来发现和确定相关关系。生态学是研究有机体及周围环境相互关系的一门学科3,研究范围包括个体、种群、群落和 基金项目2019 年科技基础资源调查专项“汉语主题词表(生物医学农业卷)编制标准、平台构建及词表融合”(2019FY202401)作者单位中国科学技术信息研究所,北京 100038 作者简介郑 影
9、(1998-),女,硕士研究生,研究方向为叙词表、信息组织。通讯作者常 春(1966-),男,博士,研究馆员,研究方向为叙词表、信息组织、数字图书馆。E-mail:8 中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 生态系统。“知识组织生态系统”(KOES)研究将知识组织系统与生态系统进行对照分析,提出将物种与概念进行对应,借鉴物种属性及其物种间关系原理方法,研究叙词表概念属性和概念间关系,取得了一系列研究成果4。捕食关系是生物间普遍存在的一种关系。研究结果显示,将概念关
10、系与种间关系进行映射之后,具有“捕食”关系的概念约占 47%5,是相关关系中最主要的一种关系类型,因此加大对概念间“捕食”作用的研究能够为相关关系的构建提供新的思路。Lotka-Volterra 捕食者-猎物模型是在一定的前提条件下对捕食者与猎物二者的种群数量变化的描述,种群数量对应到叙词表概念上即为词频。在种群数量与词频的对应研究方面,有学者基于 Logistics 模型对单个概念及多个概念的词频增长规律进行了研究,并通过概念的成熟度、增长规律的相似度等为叙词表的编制工作提供参考 6。Lotka-Volterra 模型作为Logistics 模型的进一步延伸,可用于研究概念间的词频发展规律。
11、因此,本文尝试将捕食者与猎物之间的数量变化关系引入到同样具有“捕食”关系的概念中,以此来研究具有“捕食”关系的概念的词频变化规律,并为叙词表相关关系的构建提供参考。1 相关概述 1.1 相关关系与种间关系的对应研究 在生态学中,种间关系共有 4 种,且每种关系都有不同的特点,如在捕食关系中,生物间通过捕食关系构成食物链,食物链又构成错综复杂的食物网。大型的哺乳动物一般都以多种小型动物为食,在一种猎物数量减少甚至灭绝时,捕食者也能通过其他的猎物来获得生存和活动的能量,因此一般捕食者和某种猎物之间不具有依赖性。而在寄生关系中,如菟丝子需要寄生在植物上,并通过植物来获取自身需要的营养和能量,因此菟丝
12、子对植物具有依赖性。在知识组织生态系统中,概念与物种相对应,文献信息环境与生态环境相对应。在此前提下,有学者通过将概念间相关关系与生态学种间关系的特征进行对比分析,并以依赖性、方向性作为主要判断指标,数量特征作为辅助指标5,将国际标准 ISO 25964-17中的 11 种相关关系与 4 种种间关系进行映射。通过映射,将研究学科或领域和研究对象或现象、行为及其对象或目标、人工制品及其部分(未限定为整体-部分等级关系)、物体或过程及其反作用者、复合语词及其中心名词(没有真正的等级关系)5 种相关关系划分为捕食关系,其余 6 种相关关系分别对应竞争关系、共生关系和寄生关系。1.2 Lotka-Vo
13、lterra 捕食者-猎物模型的研究应用 生态学中捕食者与猎物二者之间相互适应、相互促进,形成了一种独特的关系,Lotka-Volterra模型是二者之间经典的动力学模型之一。A.J.Lotka和 V.Volterra 各自建立了捕食与被捕食系统模型和竞争系统模型,E.P.Odum 把前述模型推广到互利系统,之后将这 3 种模型统称为 Lotka-Volterra 模型8。Lotka-Volterra 模型针对双种群演化,可用来描述捕食者和猎物之间的数量变化特征,被广泛应用于两物种间相互作用下生物数量增长模型研究中9。在其他领域,有学者等将生态种群的 Logistics、Lotka-Volte
14、rra 模型运用到 21 世纪海上丝绸之路沿线港口的发展规律探索中,了解港口间的相互作用及演化趋势,进而为我国“丝绸之路”战略的具体实施提供依据10;有学者基于 Lotka-Volterra 模型进行信息资源共享模型的构建,并通过模型仿真进行实证检验,为公共服务平台的信息资源共享问题提供新的解决思路11;还有学者在对安徽省水资源的安全状况进行测量时引入Lotka-Volterra模型,分析各个区域的水资源安全状态并采取相应的措施促进区域健康发展12。在 Lotka-Volterra 捕食者-猎物模型中,当猎物的数量上升时,捕食者由于食物资源丰富而数量也会随之增多,而捕食者数量的增多又会加大对猎
15、物的捕食力度,导致猎物的数量减少,在猎物数量下降之后捕食者的数量又会减少,即二者的数量变化呈现出一个循环的模式。如果将捕食者和猎物二者的种群数量分开,会发现二者的总体发展趋势也是保持一致的。本文主要从二者类似的数量发展趋势展开研究。中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 9 2 Lotka-Volterra 捕食者-猎物模型与概念词频的对应 2.1 研究基础 本文在基于生态学种间关系对国际标准 ISO 25964-1 中的相关关系进行分类5的基础上开展更加深入的探
16、索,首先对相关的分类原则进行简述。将相关关系的语义特征(方向性、依赖性)、字面组配特征、数量特征与种间关系的自身特征(方向性、依赖性)、物质能量传递、数量特征进行理论上的特征对应分析,并将概念之间是否具有依赖性和方向性作为概念关系判断的主要依据,将数量特征作为判断的辅助标准。国际标准 ISO 25964-1 中共有 5 种类型的相关关系被划分到“捕食”关系中,主要划分依据为是否具有单向性,并且具有非依赖性。数量特征作为辅助特征,当出现具有相关关系的两个概念,无法直接由语义信息判断其是否具有单向性和依赖性时,再根据辅助特征进行判断。对方向性与依赖性这两个主要判断指标,如物体或过程和它的反作用者:
17、除草剂与杂草这两个概念,除草剂对杂草有着损害甚至消灭的作用,杂草是被动承受者,二者之间有着明显的方向性,符合单向性的特征,且除草剂和杂草两个概念从语义关系来看并不具有依赖性,因此二者可以根据核心特征直接划分为“捕食”关系。2.2 Lotka-Volterra 捕食者-猎物模型与概念词频的实例分析“除草剂”和“农药”在农业科学叙词表中存在相关关系13。分析二者的语义特征,农药可泛指作用于农作物的药品,除草剂是指消灭杂草而对农作物不造成损害的一类药品。从方向性上看,农药包含除草剂,二者之间属于包含与被包含的关系,因此二者具有方向性。而从依赖性上看,二者均拥有完整的语义信息且可以单独存在,因此二者具
18、有非依赖性。从方向性和非依赖性可以看出二者属于“捕食”关系。在中国知网(CNKI)中分别以“除草剂”和“农药”为主题词进行检索,在全领域范围内对2000-2021 年历年文献量进行统计。将统计所得数据导入到软件 SPSS 26.0 中,绘制“除草剂”和“农药”相关文献量随年份变化的趋势图(图 1)。图 1 显示,二者的总体发展趋势是一致的,数量都呈现出先增加后减少的发展特征。在 Lotka-Volterra捕食者-猎物模型中,捕食者与猎物数量间也呈现出一致的发展规律,因此本文假设叙词表中具有“捕食”关系的概念的数量关系符合生态学中Lotka-Volterra 捕食者-猎物模型。图 1 2000
19、-2021 年“除草剂”与“农药”发文趋势 3 概念词频对比实证 3.1 实验方法 尝试将生态学中捕食者与猎物之间的数量变化特征运用到同样具有“捕食”关系的相关概念上,验证具有“捕食”关系的相关概念间的数量变化特征是否也满足捕食者与猎物数量类似的变化趋势。在使用相关叙词表对相关概念进行获取之后,使用对应的判断规则对获取的概念及相关关系进行清洗,然后使用 SPSS 统计分析软件对数据进行图表绘制、相关性分析等处理,最后基于统计结果进行分析,看是否能验证相关概念间数量变化特征。3.2 数据选取 实证时,从农业科学叙词表中任意选取某一概念,将其作为起点主题,在词表中进行相关概念的扩展延伸。如“动物油
20、”一词共有胴体、动物产品、植物油、榨油、食用油等 25 个概念及 30对相关关系,获取到的全部概念及相关关系如图 2所示。10 中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 图 2 符合“捕食”关系概念与概念关系 3.3 数据处理 3.3.1 数据清洗 根据判断规则,对获取到的 30 对相关关系进行一一判断,挑选出符合“捕食”关系的概念,对“捕食”关系的具体判断依据如表 1。表 1 “捕食”关系相关概念判断依据 概念 相关概念 判断依据 方向性 依赖性 动物油 动物 产
21、品“动物产品”包含“动物油”,二者之间具有包含与被包含关系,因此二者具有方向性“动物产品”可以包括鸡、鸭等常见畜禽类,也可指各种蛋及蛋制品和其他类产品,“动物油”也可以作为一种厨房用品独立存在,因此二者具有非依赖性 胴体“动物油”即动物油脂,“动物油”可以从“胴体”中进行提取加工,因此二者之间具有方向性“动物油”不是必须从“胴体”中提取的,如从头部或其他部位也能提取“动物油”,“胴体”也不是必须用来提取“动物油”的,还可以作为肉品供食用,因此二者之间具有非依赖性 食用油“动物油”包含于“食用油”中,二者之间具有包含与被包含关系,因此具有方向性“食用油”还可以指植物油等其他类型的油,动物脂肪除了
22、可以加工成“动物油”供食用之外,还是动物身体的重要构造成分,有着不可或缺的生理作用,因此二者具有非依赖性 胴体 家禽“家禽”经屠宰后躯干部分可变为“胴体”,“胴体”可看作“家禽”的一部分,因此二者之间具有方向性“家禽”可以用来屠宰后躯干部分成为“胴体”,但“家禽”也可以用来产蛋、获取羽毛等,“胴体”还可以指别的牲畜的躯干,并非依赖于“家禽”才具有意义,因此二者之间具有非依赖性 家畜“家畜”经屠宰后躯干部分可变为“胴体”,“胴体”可看作“家畜”的一部分,因此二者之间具有方向性 与“家禽”和“胴体”类似 食用油 榨油 先有“榨油”这一动作,再有“食用油”这一产物,因此二者之间具有方向性“食用油”可
23、以用来食用,“榨油”可以指对一切油料作物都可以进行的操作,因此二者之间具有非依赖性 精炼“精炼”是对“食用油”的一种操作,先有“榨油”这一动作,再有“食用油”这一产物,因此二者之间具有方向性 与“榨油”和“食用油”类似 植物油 轻泻药“植物油”可以作为“轻泻药”使用,而“轻泻药”并不仅仅是指“植物油”,因此二者之间有包含与被包含的方向性“植物油”可以作为“轻泻药”来使用,如蓖麻油,同时也是一种不可缺少的厨房用品。“轻泻药”除了“植物油”之外还有镁制剂、聚乙二醇等,因此二者之间具有非依赖性 润滑药“植物油”可以作为“润滑药”使用,而“润滑药”并不仅仅是指“植物油”,因此二者之间具有方向性 与“轻
24、泻药”和“植物油”类似 消沫药“植物油”可以作为“消沫药”使用,而“消沫药”并不仅仅是指“植物油”,因此二者之间有包含与被包含的方向性与“轻泻药”和“植物油”类似 榨油 先有“榨油”这一动作,再有“植物油”这一产物,因此二者具有方向性 与“榨油”和“食用油”类似 植物产品“植物油”被包含于“植物产品”,因此二者之间有包含与被包含的方向性 与“动物产品”和“动物油”类似 食用油“植物油”包含于“食用油”中,因此二者之间有包含与被包含的方向性 与“食用油”和“动物油”类似 中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.
25、31 No.12 December,2022 11 对概念间的关系映射到种间关系的结果进行选取,选择其中具有“捕食”关系的相关概念,并使用 CNKI 的主题检索对概念进行全领域检索。由于研究的是具有“捕食”关系的相关概念,若相关概念间数据量差距过大,那么对应到生态学中的捕食者与猎物,即猎物与捕食者数量差距过大,即可理解为捕食者或猎物中有一方已经濒临灭绝,那么研究就没有太大的意义。因此在选择数据时,剔除了一些数据量差异过大的概念。3.3.2 数据统计 使用 SPSS 软件进行统计分析。在进行实验时,按照相关关系将概念进行分组,同样以“动物油”这一概念为起点,将其与相关概念划分为第一组,然后以各个
26、相关概念为起点,同样与相关概念划分为一组。实验中共有 10 个概念、10 对相关关系,具体的划分结果详见表 2。表 2 具有“捕食”关系的概念具体分组 组号 概念 相关概念 1 动物油 动物产品 胴体 食用油 2 胴体 家禽 家畜 3 食用油 精炼 榨油 4 植物油 植物产品 榨油 食用油 将表 2 中 4 组具有“捕食”关系的概念,运用SPSS 软件绘制折线图,分别对 4 组概念的文献量进行统计分析(图 3)。图 3 概念折线图 3.4 数据分析 通过图 3 可以判断,以下相关概念总体发展趋势大概一致:动物油-动物产品、动物油-胴体、动物油-食用油、胴体-家禽、胴体-家畜、食用油-12 中华
27、医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 精炼、食用油-植物油、食用油-榨油。具体对每组结果进行分析。在第 1 组中,以“动物油”为起点概念,“动物油”的年度发文量在 2010 年之前整体呈现出上升的趋势,在 2010 年之后则开始逐年下降。与之相关并具有“捕食”关系的 3 个概念(动物产品、胴体、食用油)的年度发文量也均呈现出“先上升后下降”的发展趋势。在这 3 个相关概念中,“胴体”和“动物产品”的年度发文量发展趋势与“动物油”类似,三者的折线图距离更近,即三者的研
28、究热度也几乎持平。在第 2 组中,起点概念“胴体”的年度发文量整体呈现出逐年缓慢递增的趋势,与之相关的概念“家禽”“家畜”也均呈现出类似的规律,且“家禽”的年度发文量折线距离“胴体”更近。在第 3 组中,以“食用油”为概念起点,相关概念“精炼”与之呈现出类似的年度发文量发展趋势,均为先增加后减少,且二者的研究热度接近;相关概念“榨油”的年度发文量整体也呈现出先增加后减少的变化,但其与起点概念的发展趋势稍有不同。在第 4 组中,起点概念“植物油”的年度发文量呈现出先增加后减少的发展趋势,相关概念“食用油”与其趋势一致且折线较为接近。“榨油”与“植物产品”二者研究热度虽然较为接近但发展趋势相差较大
29、,经查阅叙词表得知二者并未建立相关关系。为了进一步说明概念间的相关性,使用 SPSS软件的相关性检验来进行进一步的辅助验证,选用Spearman 相关系数来作为判断指标。在使用 Spearman相关系数时,一般规定:相关系数 0.81.0 为具有极强相关,0.60.8 为具有强相关,0.40.6 为具有中等程度相关,0.20.4 为具有弱相关,0.00.2 为具有极弱相关或无相关。检索结果详见表 3。表 3 具有“捕食”关系的概念相关性检验结果 相关概念 Spearman 相关系数 P值 判断结果 动物油-动物产品 0.846 0.001 极强相关,且相关性显著 动物油-胴体 0.634 0.
30、002 强相关,且相关性显著 动物油-食用油 0.625 0.002 强相关,且相关性显著 胴体-家禽 0.607 0.003 强相关,且相关性显著 胴体-家畜 0.468 0.028 中度相关,且相关性显著 食用油-精炼 0.889 0.000 极强相关,且相关性显著 食用油-植物油 0.899 0.000 极强相关,且相关性显著 食用油-榨油 0.660 0.001 强相关,且相关性显著 表 3 显示,除了“胴体-家畜”这对相关概念之外,其余 7 对概念均显示为极强正相关或强正相关关系,且“胴体-家畜”也显示为中等程度的正相关关系。因此,在此次实验中,以“动物油”一词为起点,共获取了 25
31、 个概念、30 对相关关系,在对相关关系进行判断及清洗之后共得到 10 个概念、10 对相关关系,概念间的“捕食”关系约占全部相关关系的 33.3%。而在 10 对具有“捕食”关系的相关关系中,经过相关性检验,有 3 对相关关系呈现出极强的正相关关系,4 对相关关系呈现出强相关关系,1 对相关关系呈现出中等强度的正相关关系。总体来说,在 10 对相关关系中,结合折线图和相关性检验的分析结果,有 80%相关概念的文献量都呈现出基本一致的变化趋势,可以判定为概念间也同样存在与生态学中 Lotka-Volterra捕食者-猎物模型类似的发展规律。4 结语 自然界中捕食关系是物种之间最为普遍的一种种间
32、关系,捕食者与猎物之间紧密相连,二者种群数量呈现出规律性的变化。叙词表中具有相关关系的概念词频之间也存在着类似的联系,即具有“捕食”关系的相关关系概念间词频的变化理论上应当一致。根据实证可知,举例概念中有 80%具有“捕食”关系的概念符合 Lotka-Volterra 捕食者-猎物模型。在叙词表中,具有“捕食”关系的概念理论上大都符合这一规律。基于此种规律,可以分中华医学图书情报杂志 2022 年 12 月第 31 卷第 12 期 Chin J Med Libr Inf Sci,Vol.31 No.12 December,2022 13 别从叙词表的构建和维护两个方面探讨对叙词表的编制意义。在
33、相关关系的构建方面,可以通过概念间词频的发展趋势来发现新的相关关系。如在实证数据中,对“榨油”与“榨油机”两个概念进行统计分析,发现二者的年发文量的发展曲线几乎趋于完全一致,但在农业科学叙词表中进行查询时,二者并没有建立任何联系。从语义关系的角度来讲,榨油机是榨油的一种工具,二者之间存在明显的语义联系。因此从数量和语义两方面因素来说,二者理应存在较强的语义关联,建议在叙词表中为两个概念建立相关关系。在叙词表的更新维护方面,可以对已经建立好的关系进行检验。若存在具有“捕食”关系的相关概念,且统计发现二者的词频发展趋势的相关性并不高,则可以结合具体情况考虑是否需要清除他们之间的相关关系。此外,在实
34、证中出现了两个概念间相关系数越高,二者的词频发展趋势图就越接近的现象,因此可以考虑通过结合二者的趋势图和相关系数判断概念间相关性的紧密程度,对其相关关系的进一步细化提供参考。后续研究中,可以考虑扩大数据量,进一步验证结论的普适性。【参考文献】1 曾建勋,吴雯娜,常 春,等汉语主题词表构建研究M北京:科学技术文献出版社,2020:1-11 2 周晓英,曾建勋主题词表的社会应用研究J数字图书馆论坛,2014(10):2-6 3 邢福元,常 春基于生态学视角的叙词表概念多样性研究J情报杂志,2018,37(11):186-191 4 常 春,杨 婧,李永泽知识组织生态系统构架形成与研究进展J图书情报
35、工作,2019,63(7):146-150 5 李永泽 基于生态学种间关系的叙词表相关关系分类研究D 北京:中国科学技术信息研究所,2017 6 杨 婧,常 春基于 Logistic 种群增长规律的概念词频变化研究J情报科学,2017,35(8):15-18,50 7 Information and documentationThesauri and interoperability with other vocabularies Part 1:Thesauri for information retrieval:ISO 25964-1S2011 8 徐文科 基于微分方程的生态数学模型统计分析
36、D 哈尔滨:东北林业大学,2009 9 袁志华,孙占学,刘亚洁,等基于 Lotka-Volterra 的生物浸铀微生物生长动力学模型研究J有色金属:冶炼部分,2021(8):65-74 10 赵 旭,高苏红,周巧琳,等21 世纪海上丝绸之路沿线港口体系演化研究:基于 Logistics、Lotka-Volterra 模型J运筹与管理,2018,27(8):172-181 11 冯立超,刘国亮,张 蒙公共服务平台信息资源共享模型及仿真研究:基于 Lotka-Volterra 模型J情报杂志,2017,36(9):178-184 12 何 刚,阮 君,王莹莹,等基于 Lotka-Volterra 模型的区域水资源安全测度J水利水电技术,2021,52(9):48-56 13 农业部情报研究所农业科学叙词表M北京:中国农业出版社,1994 收稿日期:2022-10-12 本文编辑:刘 娜