1、第 48 卷 第 2 期燕山大学学报Vol.48 No.22024 年 3 月Journal of Yanshan UniversityMar.2024 文章编号:1007-791X(2024)02-0129-09属性偏序形式结构的数学形式化任蕴丽1,2,宋佳霖1,郑存芳3,洪文学1,(1.燕山大学 电气工程学院,河北 秦皇岛 066004;2.河北科技师范学院 数学与信息科技学院,河北 秦皇岛 066004;3.河北环境工程学院 信息工程系,河北 秦皇岛 066102)收稿日期:2022-08-03 责任编辑:温茂森基金项目:国家自然科学基金资助项目(81803958,62176229);河
2、北省自然科学基金资助项目(F2016203443,F2020203010)作者简介:任蕴丽(1981-),女,河北保定人,博士研究生,主要研究方向为属性偏序形式结构理论、概念认知学习;通信作者:洪文学(1953-),男,黑龙江依安人,教授,博士生导师,主要研究方向为大数据偏序结构理论、复杂概念网络、混合数据信息融合与模式识别和中医工程学,Email:hongwx 。摘 要:属性偏序形式结构,作为一种基于人类认知原理和粒计算思想的知识发现和知识表示新理论,目前已有广泛的应用,但其理论基础缺乏抽象化数学化,这势必影响该理论的系统发展。针对上述问题,研究了属性偏序形式结构的数学形式化描述问题。首先,
3、基于粒计算的思想提出了知识表示的形式化框架。在此基础上,通过定义对象集合的覆盖和最简覆盖,给出属性偏序形式结构的粒和粒群的概念,进而通过对粒衍生出粒群的充要条件的讨论,给出了属性偏序形式结构中的知识结构,从而完成属性偏序形式结构的数学形式化描述。最后,通过具体实例展示了利用数学形式化描述构造属性偏序形式结构的过程,并揭示了该过程所体现的人类认知规律。关键词:形式背景;数学形式化;属性偏序形式结构;粒计算;概念认知学习中图分类号:TP391.4 文献标识码:A DOI:10.3969/j.issn.1007-791X.2024.02.0040 引言知识表示是认知科学领域的基础问题1。从认知计算的
4、角度看,知识表示的基本认知单元是概念2。概念在学习、推理等几乎所有认知过程中都有一定意义3。形式概念分析创始人德国数学家 Wille4于 1982 年首先提出了概念的数学定义,即形式概念是由内涵和外延所组成的二元有序组。在形式概念分析理论中,一个形式背景的所有概念依据其泛化和例化关系,构成一个完备格结构,即概念格,它是形式概念分析理论的核心知识结构。概念格的 Hasse 图是其所构成的知识结构的可视化表达。目前形式概念分析理论广泛应用于数据属性约简5-7、规则提取8、知识挖掘9-10等领域。然而,由于概念格的 Hasse 图是有交叉的网状图,所以当数据量较大时,其所表达的知识结构可视化效果不理
5、想。同时,在形式概念分析理论中,内涵和外延通过属性幂集和对象幂集间的一对闭包算子来相互唯一确定,这就将人们认知事物的过程看作是一次完成的,然而在现实生活中,人们对客观事物的认知往往是一个渐进的过程,一开始人们的认知是模糊的片面的,但随着学习到事物更多的特征,人们对其认识才逐渐清晰和完善。因此,为了更好地反映人类认知的实际过程,迫切需要一种符合人类认知原理的知识发现和知识表示的方法。属性偏序形式结构是洪文学教授11-12在形式概念分析的基础上,根据人类认知原理和粒计算思想提出来的知识发现和知识表示的可视化新理论。在事物所具有的多种属性(特征)中,有些属性可以覆盖较多的对象(事物),称其为共有属性
6、,而有些属性则仅为个别对象所具有,称这样的属性是独有属性。在认知过程中,人们往往将具有共有属性的事物聚在一起,而将具有独有属性的对象彼此远离,从而达到区分事物的目的。在属130 燕山大学学报2024性偏序形式结构中,以属性覆盖对象的多少来刻画属性的普遍性的强弱,普遍性强的属性置于结构的上层,特异性强的属性置于下层,从上往下属性的普遍性逐层递减,特异性逐层增强,从而达到认识和区分事物的目的,从下往上,属性的普遍性逐层增强,达到聚类的目的。属性偏序形式结构中的粒(节点)并不要求是形式概念,而是由属性决定的属性对象有序多元组。随着该结构中层次的加深,粒中的属性集和对象集逐渐实现相互唯一确定,从而很好
7、地刻画人类对事物(对象)的认知过程。该结构的可视化表达即属性偏序形式结构图,是一个无交叉的图,可以将形式背景中蕴含的知识清晰地呈现出来。鉴于属性偏序形式结构理论符合人类认知原理,并且具有良好的可视化效果,该理论在概念认知学习领域吸引了学者们的关注,并且广泛地应用于中医药知识发现13-17、语义排歧18-19、医学诊断数据挖掘20-21等领域。在属性偏序形式结构的应用研究发展迅速的同时,偏序形式结构的理论研究却相对薄弱。文献22-24主要是从计算机算法优化和可视化等角度对属性偏序形式结构进行研究。文献25基于粒计算和三支决策的思想,探讨了三支属性偏序形式结构的构造方法。而有关属性偏序形式结构理论
8、的基础研究,特别是该理论的数学形式化则很少有相关的研究成果。数学形式化框架可以为属性偏序形式结构的很多基本问题的系统研究提供坚实的基础,比如基于属性偏序形式结构的知识发现算法与解释、相关理论与概念认知学习的结合与进一步发展等。因此对该理论基本原理和方法的抽象的数学形式化描述是非常有价值的科学问题。本文旨在探索属性偏序形式结构基本理论的数学形式化描述。首先,基于粒计算思想给出知识表示的形式化框架。在此基础上,通过定义对象集合的覆盖、最简覆盖,属性偏序形式结构中的粒、粒群等,讨论粒群构成的知识结构、簇集等,进而完成属性偏序形式结构(图)的数学形式化描述。1 基于粒计算思想的知识表示形式化框架 粒计
9、算26的思想与人们在解决问题或认识客观事物时将部分事物不加区分地看作一个整体的处理方式是一致的。客观世界中的事物纷繁复杂,人们认识客观世界时,由于信息不完备、认知能力有限、所要解决的问题精度要求不高等原因,人们会很自然地将客观事物分成若干组、群或簇集,也就是说按照一定的准则将相似的或者相关的事物看作一个整体而不加区分,这些整体称为“粒”,这个过程可称为粒化。人们一般对粒内的事物不加区分,而关注不同粒间的关系。粒化时的标准不同,人们会得到精度不同的粒。粒的精度的大小可以称为粒度,粗粒度的粒涵盖较多的对象,粒化时所使用的标准较粗,反之,细粒度的粒则涵盖较少的对象,粒化的标准也更精细。每一次粒化所形
10、成的粒都处在同一个粒层,同一个粒层中的粒构成对论域的一个覆盖或划分。人们对论域施以不同的粒化,会得到不同的粒层,将这些粒层按粒度从粗到细排列,可以得到多层次的知识体系。人们在认识客观世界或解决问题时,可以很自由地在不同的粒层间进行切换。根据粒计算的思想,知识体系的表示形式可以是知识粒构成的分层次的结构。知识表示的形式化框架是三元组(D,G,R),其中 D 是数据,它包含了研究对象及其所具有的属性与特征,例如形式概念分析中的形式背景、粗糙集理论中的信息表等;G 是根据某些标准由 D 中的对象生成的粒的集合;R 是粒间的关系或在此基础上所生成的粒结构。譬如,在形式概念分析中,数据 D 是由对象集、
11、属性集及二者之间的二元关系组成的三元组,它能够反映每一个对象所具有的属性;形式概念分析中 G 里的粒是形式概念,即由外延和内涵组成的有序二元组,二者由对象幂集和属性幂集间的两个闭包算子相互唯一确定;形式概念分析中R 是所有形式概念的集合上的偏序关系,它通过形式概念的外延(或内涵)的包含关系来定义,在此偏序关系基础上,全体粒(形式概念)构成了多层次的网状结构。这一结构就是形式背景(数据)中所蕴含的知识的表示,并且 Hasse 图可以将这一知识结构以图形的方式可视化表达。此外,决策树、商空间等都符合上述知识表示的形式化框架。第 2 期任蕴丽 等 属性偏序形式结构的数学形式化131 2 属性偏序形式
12、结构的数学形式化描述2.1 属性偏序形式结构的基本思想 人类在认知客观世界时,往往会根据事物所具有的属性或特征,将相似或相近的事物聚集在一起,而使差异较大的事物远离相近的事物。同时,人类对客观事物的认知往往不是一次完成的,开始的认知比较模糊,随着获取事物越来越多的属性和特征,人们对它的认识才逐渐清晰。为了反映人类认知的这一特征,将粒定义为属性(或属性集合)及其所描述的对象集合所组成的有序二元组。粒中的属性(或属性集合)的普遍性强弱有较大差别,有些属性(或属性集合)为较多对象所具有,从而有较强的普遍性,此时粒的粒度较大(粗);而有些属性则仅有较少的对象才具有,所以它的普遍性较弱而特异性较强,此时
13、粒的粒度较小(细)。在构造知识体系时,人们会自上而下地通过对普遍性强的属性(或属性集合)加入新属性而区分不同的事物,另一方面,人们还可以自下而上地通过去除特异性强的属性而将相似的事物聚类。因此,人类的知识体系的组织结构,一定是多层次的,在这一结构中,普遍性强的粗粒度的粒在上层,随着更多属性的加入,层次逐渐加深,粒的普遍性逐渐降低特异性逐渐加强,粒的粒度也逐渐加细,不同粒度的粒之间依据偏序关系相连接。2.2 属性偏序形式结构中的数据 形式背景及相关基础知识 与形式概念分析类似,属性偏序形式结构所处理的数据也是以形式背景的形式呈现。为此,本小节先介绍形式概念分析中形式背景、形式概念等相关基础知识,
14、并在此基础上,给出属性(属性集)的覆盖基数的概念及性质。定义 14 形式背景 K=(U,A,I)是由对象集U、属性集 A 及二者间的二元关系 I 所组成的三元组。对于 xU,aA,表达式(x,a)I 或 xIa 表示对象 x 具有属性 a。通常,形式背景可由形如表 1 的二值表格来表示。在表 1 中所示的形式背景中,U=1,2,3,4,5,6,7,A=a,b,c,d,e,f,g,第一行列出了所有的属性,第一列列出了所有的对象,在行列交叉点处的数字“1”表示相应行中的对象具有相应列中的属性,空白则表示相反的情形。表 1 一个形式背景Tab.1 A formal contextabcdefg111
15、11211131114115111611117111 对于任意的 BA 和 VU,定义如下两个算子:f(V)=a A|(u,a)I,u V,g(B)=uU|(u,b)I,bB。定义 24在形式背景 K=(U,A,I)中,对于VU 和 BA,如果 f(V)=B 并且 g(B)=V,则称二元组(V,B)是一个形式概念。其中 V 和 B 分别称为形式概念(V,B)的外延和内涵。定义 34 设(X1,B1)和(X2,B2)是形式背景K=(U,A,I)中的两个概念,如果 X1X2(即 B2B1),则(X1,B1)称为(X2,B2)的子概念,(X2,B2)称为(X1,B1)的超概念,记为(X1,B1)(X
16、2,B2)。K 中的全体概念连同其间的偏序关系构成一个完备格,称为概念格。为了描述属性的普遍性强弱,给出属性的覆盖基数的概念。定义 4 设 K=(U,A,I)是一个形式背景,对于任意的 aA,集合 g(a)的基数称为属性 a 的覆盖基数,记为 G(a),即 G(a)=|g(a)|=|xU|xIa|。同理,对于 BA,称|g(B)|为属性集合 B的覆盖基数,记为 G(B)。性质 1 设 K=(U,A,I)是一个形式背景,则有以下结论成立:1)若 BCA,则 G(B)G(C);2)对于 B,CA,有G(BC)minG(B),G(C),G(BC)maxG(B),G(C);3)对于 B,CA,有|g(
17、B)g(C)|=G(B)+G(C)-G(BC);4)若 B,CA 为互斥属性集,即 g(B)g(C)=,则 G(BC)=0,进而有|g(B)g(C)|=132 燕山大学学报2024G(B)+G(C);5)若 B,CA 为对立属性集,即 g(B)g(C)=且 g(B)g(C)=U,则G(B)+G(C)=|U|。证明 1)由于对于任意 WA,有 g(W)=u|uIa,aW,故由 BC 可知 g(B)g(C),从而G(B)G(C)。2)对于 B,CA,有 B,CBC,B,CBC,故由 1)知 G(BC)G(B)且 G(BC)G(C),从而G(BC)minG(B),G(C)。同理,G(BC)G(B)且
18、 G(BC)G(C),从而G(BC)maxG(B),G(C)。3)|g(B)g(C)|=|g(B)g(C)-g(B)|=|g(B)|+|g(C)-g(B)|=G(B)+|g(C)-g(BC)|=G(B)+|g(C)|-|g(BC)|=G(B)+G(C)-G(BC)。4)当 B 和 C 为互斥的属性集合时,G(BC)=|g(BC)|=|g(B)g(C)|=0。进一步由 3)知|g(B)g(C)|=G(B)+G(C)。5)当 B 和 C 为对立的属性集合时,由4)可知G(BC)=0,代入 3)中的公式可知 G(B)+G(C)=|g(B)g(C)|=|U|。由性质 1 的 1)和 2)可知,属性集的
19、覆盖基数随着属性的增多而减小,随着属性的减少而增大,因此,属性集的覆盖基数可以作为衡量属性集普遍性强弱的一个度量。为了方便表达,称 g(B)是属性集 B 所覆盖的对象。定义 5 在形式背景 K=(U,A,I)中,如果属性 aA 满足 G(a)=|U|,则称 a 为 K 中的一个最大共有属性。性质 2 在形式背景 K=(U,A,I)中,属性 a是最大共有属性,当且仅当对任意的 uU,有uIa,即 g(a)=U。2.3 属性偏序形式结构中粒的数学形式化描述对于任意 BA,由于对象集合 g(B)中的对象都具有 B 中的所有属性,所以它们可以聚成一个由属性集合 B 所决定的粒。但是为了表达形式背景中的
20、知识结构,在属性偏序形式结构中,仅选取其中的一部分粒。为了描述粒选取的标准,给出对象集合的覆盖和最简覆盖的定义。定义 6设在形式背景 K=(U,A,I)中,U1U,A1A。A1中的属性 b1,b2,bk称为 U1相对于 A1的一个覆盖,如果 ki=1g(bi)U1,或者 U1-ki=1g(bi),并且a|a f(u),u U1-ki=1g(bi)A1c。对于 U1相对于 A1的一个覆盖 b1,b2,bk,如果 ki=1g(bi)U1,则称该覆盖是完全覆盖,反之,如果 U1-ki=1g(bi),则称该覆盖是非完全覆盖。完全覆盖和非完全覆盖可以统称为覆盖。如果属性 b1,b2,bk构成 U1相对于
21、 A1的一个覆盖,可以说属性 b1,b2,bk覆盖 U1(相对于 A1),或者b1,b2,bk是 U1相对于 A1的一个覆盖。定义 7设在形式背景 K=(U,A,I)中,U1U,A1A。A1中的属性 b1,b2,bk称为 U1相对于 A1的一个最简覆盖,如果满足下列条件:1)属性 b1,b2,bk构成 U1相对于 A1的一个覆盖;2)对于任意 i1,2,k,bj|1jk,ji不构成 U1相对于 A1的一个覆盖;3)ki=1GK1(bi)在 U1相对于 A1的满足式(2)的覆盖中是最大的。其中,GK1()表示属性在子背景 K1=(U1,A1,I|U1A1)下的覆盖基数。对于 U1相对于 A1的最
22、简覆盖 b1,b2,bk,如果 b1,b2,bk是 U1相对于 A1的完全覆盖,则称该覆盖是最简完全覆盖,否则为最简非完全覆盖。下面给出属性偏序形式结构中粒的数学表达。由于属性偏序形式结构中的粒涉及粒的选择问题,所以其中的粒以粒群的形式出现。定义 8 在形式背景 K=(U,A,I)中,粒群是形如(N;N1,N2,Ns)的双层多元组,其中 N 是顶点粒,N1,N2,Ns是子粒。顶点粒 N 是三元组 N=(B,g(B),O),其中 BA,g(B)是 B 所覆盖的对象,O 是顶点粒 N 包含的对象,也是顶点粒 N第 2 期任蕴丽 等 属性偏序形式结构的数学形式化133 下需要进一步学习的对象,Og(
23、B)。子粒的结构为 Ni=(Bi,g(Bi),Oi),i=1,2,s。其中 Bi=Bbi,i=1,2,s,O1=Og(b1),Oi=O g(bi)-1j ig(bj),(1)i=2,3,s,属性 b1,b2,bs是 O 相对于 Bc的最简覆盖。称 bi是子粒 Ni的核心属性,i=1,2,s。显然,Oig(Bi),i=1,2,s。在粒群(N;N1,N2,Ns)中,从对象的角度而言,子粒 N1,N2,Ns构成顶点粒 N 的一个划分,如下图 1 所示。图 1 中虚线所示部分只有在最简非完全覆盖的情形才存在。从图中可以看到,粒群中顶点粒和子粒是通过子粒的核心属性建立联系的。图 1 粒群内划分示意图Fi
24、g.1 Schematic diagram of division inside a granular group对于每一个子粒 Ni(i=1,2,s),当 Oi存在相对于 Bic的最简覆盖时,还可以得到以 Ni为顶点粒的新的粒群,依次下去可得到粒群构成的结构,如图 2 所示。图中虚线框住的每一部分都是一个粒群,从上往下,粒群对对象的描述逐渐加细。图 2 粒群结构图Fig.2 Diagram of the structure of granular groups2.4 属性偏序形式结构中粒间关系及知识结构的数学形式化描述 属性偏序形式结构中的粒通过最简覆盖构成一个双层的粒群,以粒群的子粒为顶点
25、粒可以继续向下衍化出新的粒群因此,目前组成属性偏序形式结构的关键问题有两个:1)确定首粒,这是整个结构构成的开端;2)确定粒群向下展开的终止条件。关于首粒的确定,可以分成两种情况:如果形式背景 K 存在最大共有属性 a,则首粒为(a,U,U);否则,首粒为(,U,U)。这里为表达上的简便,以 a 代替a,后续类似的简化不再赘述。关于粒群向下展开的终止条件,有如下定理和推论。定理 1在形式背景 K=(U,A,I)中,粒 N=(B,g(B),O)可以展开成粒群当且仅当存在 uO,使得 f(u)B。证明 必要性:反证,假设对任意 u O,f(u)B,则对任意 bBc,有 ug(b),由 u 的任意性
26、知 Og(b)=,从而 O 相对于 Bc的最简覆盖不存在,所以粒 N=(B,g(B),O)不可展开成粒群,矛盾。充分性:如果存在 uO,使得 f(u)B,记O=uO|f(u)Bc,B=b|bf(u)Bc,uO。按如下方法可得 O 相对于 Bc的覆盖(当 O=O 时,该覆盖是完全覆盖,否则可得非完全覆盖):在子背景 K1=(O,B,I|OB)下找覆盖基数最大的属性,记为 b1,即 b1=arg maxbBGK1(b)。在子背景 Ki=(Oi,Bi,I|OiBi)下找覆盖基数最大的属性,记为 bi,即bi=arg maxbBiGKi(b)。其中Oi=O-1ji-1g(bj),Bi=B-bj|1ji
27、-1,i=2,3,m,m 满足 O-1jmg(bj)=。按上述方法可得 O 相对于 Bc的覆盖,从中去掉多余的属性(即满足 O 1im,ijg(bi)=O mi=1g(bi)的属性 bj)。由于可能存在覆盖基数相同的属性,所以上述覆盖有可能不唯一,选取没有多余属性且覆盖基数之和最大的,即是最简覆盖,记为 c1,c2,134 燕山大学学报2024cs(sm)。进而可得以粒 N=(B,g(B),O)为顶点粒的粒群(N;N1,N2,Ns),其中子粒为 Ni=(Bi,g(Bi),Oi),i=1,2,s。这里,Bi=Bci,i=1,2,s,O1=Og(c1),Oi=O g(ci)-1j ig(cj),i
28、=2,3,s。推论 1在形式背景 K=(U,A,I)中,粒 N=(B,g(B),O)不可展开成粒群当且仅当对任意uO,f(u)B。不可展开成粒群的粒称为终点粒。至此,可以得到属性偏序形式结构:从首粒出发,按照定理 1 充分性证明中的方法得到第一个粒群,其中的子粒是对论域 U 的一个粗糙的划分,进而再以子粒为顶点粒继续向下衍生出新的粒群,可得论域 U 的更细的划分。继续这个过程,直至子粒的对象仅具有该粒中的属性,此时的子粒即为终点粒,不会继续向下衍生新粒。将粒群中的子粒置于顶点粒的下方,每个粒群中顶点粒与子粒间建立连接边,终点粒与底层粒(A,)间建立连接边,即得属性偏序形式结构图,记作 APOS
29、D(K)。在属性偏序形式结构图中,节点即为属性偏序形式结构中的粒,以后可以对两种说法不加区分。从横向看,属性偏序形式结构图中的每一层都是对论域 U 的一个划分,处在上层的划分粒度较粗,随着层次的加深,对论域 U的划分逐层加细;从纵向看,每一条支路代表一个对象,每一个对象通过唯一的一条支路表达,支路上的各节点(粒)的核心属性即为该对象所具有的全部属性。属性偏序形式结构图是一个多层次的无交叉图,在形式背景中蕴含的知识结构的表示方面,具有良好的可视化效果。定义 9 在形式背景 K=(U,A,I)的属性偏序形式结构图中,以粒 N=(B,g(B),O)为顶点粒的粒群及其向下衍生出的全部粒构成的结构称为簇
30、集,记作 Cluster(N)。在簇集 Cluster(N)中,对象的一个共同点是具有属性集 B 中的所有属性。当 O=g(B)时,该簇集即为属性集 B 所覆盖(或者说描述)的全部对象所成的簇集,这是 APOSD(K)的一个子图;当Og(B)时,该簇集是属性集 B 所覆盖的部分对象所组成的,为了得到属性集 B 所描述的全部对象所组成的簇集,只需取 O=g(B),以 N=(B,g(B),g(B)为首粒,逐层向下衍生即可。由于在属性偏序形式结构图中,除首粒之外,每一个粒 N=(B,g(B),O)都是某个粒群的子粒,其中的 O 可通过式(1)计算得出。因此,粒 N=(B,g(B),O)主要是由其属性
31、集 B 决定的,所以有时可仅用粒三元组中的前两个元素作成的二元组来表示粒,即将图中的节点简记为 N=(B,g(B);进一步,属性集 B 是通过在顶点粒的属性集合上添加该粒的核心属性而得到的,因此,有时在属性偏序形式结构图中,仅以节点的核心属性标示节点。3 属性偏序形式结构数学形式化构造实例表 2 所示的是著名的“生物和水”形式背景K=(U,A,I),其中对象 1 至 8 分别为水蛭、娃娃鱼、青蛙、狗、水草、芦苇、豆子和玉米。属性 a 至 i分别表示需要水、水中生活、陆地上生活、需要叶绿素、双子叶植物、单子叶植物、能运动、有四肢和哺乳。表 2“生物和水”形式背景Tab.2 The formal
32、context of lives and waterabcdefghi111121111311111411111511116111117111181111 下面将按照第 2 章介绍的属性偏序形式结构的数学形式化描述,从首粒开始通过确定最简覆盖,构造粒和粒群,逐层向下衍生出该形式背景的整个属性偏序形式结构。首先,由于属性 a 满足 g(a)=U,所以首粒为N1=(a,U,U)。在子形式背景 K1=(U,A-a,I|U(A-a)下,G(b)=G(c)=5,G(d)=G(g)=4,G(f)=G(h)=3,G(e)=G(i)=1,取定覆盖基数最大的属性 b。接下来,在子形式背景(U-g(b),A-a,
33、b,I|(U-g(b)(A-a,b)下覆盖基数最大的属性为属性 c。由于 g(b)g(c)=U,所以b,c是 U第 2 期任蕴丽 等 属性偏序形式结构的数学形式化135 相对于ac的一个覆盖。由于 b 和 c 都不能单独覆盖 U,并且二者的覆盖基数在子背景 K1下是最大的,所以b,c是 U 相对于ac的一个最简覆盖。因此可得首粒 N1下的子粒为 N1,1=(ab,g(ab),Ug(b)=(ab,12356,12356),N1,2=(ac,g(ac),Ug(c)-g(b)=(ab,34678,478)。这里为了简便,用 12356 来代替集合1,2,3,5,6,类似的简化不再赘述。三者构成的粒群
34、为(N1;N1,1,N1,2),如图 3 所示。图 3 第一层的粒群图Fig.3 Diagram of the granular group of the first layer此时,将形式背景中的生物分成 N1,1所代表的水生生物和 N1,2所代表的陆生生物两大类。接下来,分别以 N1,1和 N1,2为顶点粒,继续向下衍生出新的粒群。下面仅以 N1,1向下衍生为例。在子 形 式 背 景 K1,1=(O1,1,A-a,b,I|O1,1(A-a,b)下,覆盖基数最大的属性为 g,进而在子 形 式 背 景(O1,1-g(g),A-a,b,g,I|(O1,1-g(g)(A-a,b,g)下,覆盖基数最
35、大的属性为d,并且 g(g)g(d)O1,1,g 和 d 都不能单独覆盖 O1,1,并且二者的覆盖基数在子背景 K1,1下是最大的,所以g,d是 O1,1相对于a,bc的一个最简覆盖,这里 O1,1是粒 N1,1包含的对象,即O1,1=1,2,3,5,6。在此基础上,可得 N1,1的子粒 N1,1,1=(abg,g(abg),O1,1g(g)=(abg,123,123)和 N1,1,2=(abd,g(abd),O1,1g(d)-g(g)=(abd,56,56)。从而可得 N1,1为顶点粒的粒群(N1,1;N1,1,1,N1,1,2),如图 4 所示。此时,将水生生物分为 N1,1,1所代表的水
36、生动物和 N1,1,2所代表的水生植物两类。图 4 第二层的粒群图Fig.4 Diagram of the granular group of the second layer同样地,分别以 N1,1,1和 N1,1,2为顶点粒,可以继续向下衍生出新的粒群。下面以 N1,1,1向下衍生为例。粒 N1,1,1包含的对象为 O1,1,1=1,2,3,由于 f(1)=a,b,g,所以得到 O1,1,1相对于a,b,gc的最简非完全覆盖h。从而 N1,1,1的子粒为 N1,1,1,1=(abgh,23,23)。二者构成的粒群为(N1,1,1;N1,1,1,1),如图 5 所示。图 5 第三层的粒群图F
37、ig.5 Diagram of the granular group of the third layer此时将水生动物分为 N1,1,1,1所代表的有四肢的水生动物和 O1,1,1-g(h)所表示的没有四肢的水生动物两类。同理可得 O1,1,1,1相对于a,b,g,hc的最简非完全覆盖c,从而 N1,1,1,1向下衍生出子粒N1,1,1,1,1=(abghc,3,3)。由于 f(3)=a,b,g,h,c,所以根据推论 1 知 N1,1,1,1,1是一个终点粒,至此不能再向下衍生出粒群了。同时,将 N1,1,1,1,1所代表的有四肢的两栖动物“青蛙”和 O1,1,1,1-g(c)所表示的有四肢
38、的非两栖水生动物“娃娃鱼”区分开来。对于其他粒也可类似讨论,最终的属性偏序形式结构图如图 6 所示。136 燕山大学学报2024图 6 属性偏序形式结构图Fig.6 Attribute partial order formal structure diagram以上展示了对于给定的形式背景,如果根据数学形式化描述来构造属性偏序形式结构。同时,通过对“青蛙”和“娃娃鱼”的区分和认识的过程,可以认识到,在属性偏序形式结构中,随着层次的加深,粒中的属性不断叠加,粒所描述的对象范围逐渐缩小,最终实现对具体对象的认识和区分的目的,这与人类认知客观事物的规律是一致的。4 结论属性偏序形式结构是一种具有可视
39、能力的知识发现和知识表示的理论。本文针对该理论的研究多集中在算法和应用方面,而基础理论的抽象数学化研究不足的问题,探讨了属性偏序形式结构的数学形式化描述。首先,基于粒计算的思想提出了知识表示的形式化框架,即数据、粒和粒间结构所组成的三元组。在此基础上,通过定义属性的覆盖基数、对象集合的覆盖和最简覆盖,给出了属性偏序形式结构的粒和粒群的概念,即粒群是由顶点粒所包含的对象集的最简覆盖所确定的双层多元组,并且粒群中的子粒在一定条件下有衍生出新粒群的能力。最终,通过给出属性偏序形式结构中的粒衍生出粒群的充要条件,解决了属性偏序形式结构的构造,从而完成了该理论的数学形式化描述。最后,通过具体实例展示了利
40、用数学形式化描述构造属性偏序形式结构的过程,以及其中体现的人类认知客观事物的规律。参考文献 1 李金海 闫梦宇 徐伟华 等.概念认知学习的若干问题与思考 J.西北大学学报 自然科学版 2020 50 4 501-515.LI J H YAN M Y XU W H et al.Some problems and thoughts on concept-cognitive learning J.Journal of Northwest University Natural Science Edition 2020 50 4 501-515.2 李金海 米允龙 刘文奇.概念的渐进式认知理论与方法 J
41、.计算机学报 2019 42 10 2233-2250.LI J H MI Y L LIU W Q.Incremental cognition of concepts theories and methods J.Chinese Journal of Computers 2019 42 10 2233-2250.3 LI J H MEI C L XU W H et al.Concept learning via granular computing a cognitive viewpoint J.Information Sciences 2015 298 447-467.4 WILLE R.R
42、estructuring lattice theory an approach based on hierarchies of concepts M/RIVAL I.Ordered Sets.Dordrecht Holland D.Reidel Publishing Company 1982 445-470.5 LI K W SHAO M W WU W Z.A data reduction method in formal fuzzy contexts J.International Journal of Machine Learning and Cybernetics 2017 8 4 11
43、45-1155.6 SHAO M W LI K W.Attribute reduction in generalized one-sided formal contexts J.Information Sciences 2017 378 317-327.7 LI J WANG X WU W et al.Attribute reduction in inconsistent formal decision contexts J.International Journal of Machine Learning and Cybernetics 2017 8 1 81-94.8 WU W Z QIA
44、N Y H LI T et al.On rule acquisition in incomplete multi-scale decision tables J.Information Sciences 2017 378 282-302.9 MI Y L LIU W Q SHI Y et al.Semi-supervised concept learning by concept-cognitive learning and concept space J.IEEE Transactions on Knowledge and Data Engineering 2022 34 5 2429-24
45、42.10 MI Y L SHI Y LI J H et al.Fuzzy-based concept learning method exploiting data with fuzzy conceptual clustering J.IEEE Transactions on Cybernetics 2022 52 1 582-593.11 HONG W X LI S X YU J P et al.A new approach of generation of structural partial-ordered attribute diagram J.ICIC Express Letter
46、 Part B Applications 2012 3 4 823-830.12 洪文学 李少雄 张涛 等.大数据偏序结构生成原理 J.燕山大学学报 2014 38 5 388-393.HONG W X LI S X ZHANG T et al.The generation principle of partial-ordered structure towards big data J.Journal of Yanshan University 2014 38 5 388-393.13 FAN F J HONG W X SONG J L et al.A method of attribute
47、 partial-ordered structure diagram for the composition structures of prescription and knowledge discovery J.ICIC Express Letters 2016 10 3 593-600.14 YAN E L SONG J L HONG W X.Knowledge discovery and visualization of kidney-related pattern and treatment based on attribute partial-ordered structure d
48、iagram J.ICIC Express Letters Part B Applications 2017 8 9 1331-1338.15 YAN E L SONG J L LIU C N et al.A research on syndrome element differentiation based on phenomenology and mathematical 第 2 期任蕴丽 等 属性偏序形式结构的数学形式化137 method J.Chinese Medicine 2017 12 19.16 李亚希 刘超男 洪文学.基于属性偏序理论探讨李坤寅治疗子宫腺肌病用药规律 J.山东
49、中医杂志 2020 39 6 560-564.LI Y X LIU C N HONG W X.Discussion on Li Kunyins law of medication in treating adenomyosis based on attribute partial order theory J.Shandong Journal of Traditional Chinese Medicine 2020 39 6 560-564.17 张晓希 洪文学 王晓颖 等.基于属性偏序原理的老年 2 型糖尿病患者舌象特征研究 J.糖尿病新世界 2021 24 23 1-4.ZHANG X X
50、 HONG W X WANG X Y et al.Study on tongue features of elderly patients with type 2 diabetes based on attribute partial order principle J.New World of Diabetes 2021 24 23 1-4.18 YU J P HONG W X QIU C L et al.A new approach of attribute partial order structure diagram for word sense disambiguation of E
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100