收藏 分销(赏)

关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt

上传人:精*** 文档编号:2292713 上传时间:2024-05-25 格式:PPT 页数:44 大小:742.50KB 下载积分:14 金币
下载 相关 举报
关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt_第1页
第1页 / 共44页
关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt_第2页
第2页 / 共44页


点击查看更多>>
资源描述
关联规则挖掘关联规则挖掘 以仲景方配伍规律挖掘为例以仲景方配伍规律挖掘为例杨雪梅 博士中医证研究基地yxm_目录目录n n解决的问题n n关联规则相关理论基础n nSPSS CLEMENTINE中实现的关联规则挖掘算法n n案例:仲景方配伍规律挖掘解决的问题解决的问题关联关联n n购物篮问题:购物篮问题:购物篮问题:购物篮问题:顾客购买了牛奶后,购买面包的可顾客购买了牛奶后,购买面包的可能性有能性有多大多大多大多大n n药性规律问题:药性规律问题:药性规律问题:药性规律问题:是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是多少?如果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?n n处方问题:处方问题:处方问题:处方问题:*专家处方中开出专家处方中开出生姜生姜生姜生姜*桂枝桂枝桂枝桂枝*白芍三白芍三白芍三白芍三味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例有多少?专家处方中开出专家处方中开出生姜生姜生姜生姜*桂枝桂枝桂枝桂枝*白芍三味药用于治疗白芍三味药用于治疗白芍三味药用于治疗白芍三味药用于治疗寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间的比值是多少?的比值是多少?的比值是多少?的比值是多少?处方集举例处方集举例n n1麻黄;桂枝;白芍n n2麻黄;桂枝;白芍;干姜 n n3麻黄;白术;干姜 n n4桂枝;白芍;白术;干姜 n n5麻黄;桂枝;白术;干姜 目录目录n n解决的问题n n关联规则相关理论基础关联规则关联规则分类关联规则分类关联规则兴趣度参数兴趣度参数n nSPSS CLEMENTINE中实现的关联规则挖掘算法n n案例:仲景方配伍规律挖掘关联规则关联规则n n关联规则关联规则 (Association Rule)(Association Rule)是形如是形如R R:A AB B的规则,的规则,满足满足A A B B=&=&supsup(R R)minmin_ _supsup&confconf (R R)minmin_ _confconf。n n其中,其中,A,BA,B均为属性集合,均为属性集合,supsup(R R)为规则为规则R R的支持度,的支持度,minmin_ _supsup为最小支持度阈值;为最小支持度阈值;confconf(R R)为规则为规则R R的置信的置信度,度,min_confmin_conf为最小置信度阈值。为最小置信度阈值。n n如:如:泽泻泽泻泽泻泽泻 白术白术白术白术 猪苓猪苓猪苓猪苓 =茯苓茯苓茯苓茯苓分类关联规则分类关联规则n n分类关联规则分类关联规则 (Class Association Rule)(Class Association Rule)是形是形如如R R:C CD D的规则,满足的规则,满足C C D D=&=&supsup(R R)minmin_ _supsup&confconf(R R)minmin_ _confconf。n n其中,其中,C C为条件属性为条件属性(或中药或中药)集合,集合,D D为决策为决策属性属性(或方剂分类或方剂分类);supsup(R R)为规则为规则R R的支持度,的支持度,minmin_ _supsup为最小支持度阈值;为最小支持度阈值;confconf(R R)为规则为规则R R的置信度,的置信度,min_confmin_conf为最小置信度阈值。为最小置信度阈值。n n如:桂枝如:桂枝*生姜生姜*白芍白芍寒证寒证 兴趣度参数兴趣度参数 规则规则规则规则R R的的的的支持度支持度支持度支持度定义如下:定义如下:定义如下:定义如下:supsup(R R)=)=P P(A A B B););P P(A A B B)为为为为A A和和和和B B同时出现的概率;同时出现的概率;同时出现的概率;同时出现的概率;规则规则规则规则R R的的的的置信度置信度置信度置信度定义如下:定义如下:定义如下:定义如下:confconf(R R)=)=P P(B B|A A););P P(B B|A A)为在为在为在为在A A出现条件下出现出现条件下出现出现条件下出现出现条件下出现B B的条件概率。的条件概率。的条件概率。的条件概率。规则规则规则规则R R的的的的提升度提升度提升度提升度定义如下:定义如下:定义如下:定义如下:lift(R)=lift(R)=P P(B B|A A)/)/P P(B B););条件条件条件条件A A的出现对的出现对的出现对的出现对B B出现概率的提升,说明出现概率的提升,说明出现概率的提升,说明出现概率的提升,说明A A与与与与B B之间之间之间之间的相关性,大于的相关性,大于的相关性,大于的相关性,大于1 1为相关,小于为相关,小于为相关,小于为相关,小于1 1则不相关则不相关则不相关则不相关兴趣度参数兴趣度参数n n支持度(支持度(支持度(支持度(supportsupport)、置信度)、置信度)、置信度)、置信度(confidenceconfidence)、提升度(或作用度,)、提升度(或作用度,)、提升度(或作用度,)、提升度(或作用度,liftlift)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要指标,支持度反映规则的指标,支持度反映规则的指标,支持度反映规则的指标,支持度反映规则的普遍性普遍性普遍性普遍性,置信度反,置信度反,置信度反,置信度反映规则的映规则的映规则的映规则的可靠性可靠性可靠性可靠性,提升度反应规则两侧属性,提升度反应规则两侧属性,提升度反应规则两侧属性,提升度反应规则两侧属性之间的之间的之间的之间的相关性相关性相关性相关性,通常选择支持度、置信度、,通常选择支持度、置信度、,通常选择支持度、置信度、,通常选择支持度、置信度、提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。n n关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:即即即即最小支持度阈值最小支持度阈值最小支持度阈值最小支持度阈值minmin_ _supsup为为为为5%5%;最小置最小置最小置最小置信度阈值信度阈值信度阈值信度阈值min_confmin_conf为为为为50%50%。关联规则关联规则举例举例n n例如:例如:例如:例如:泽泻泽泻泽泻泽泻 白术白术白术白术 猪苓猪苓猪苓猪苓 =茯苓茯苓茯苓茯苓sup=0.1565;conf=0.9684;lift=2.24 sup=0.1565;conf=0.9684;lift=2.24 共有共有共有共有591591首脾胃湿热方中有首脾胃湿热方中有首脾胃湿热方中有首脾胃湿热方中有9292首方剂同首方剂同首方剂同首方剂同时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,故规则的支持度为故规则的支持度为故规则的支持度为故规则的支持度为15.65%15.65%;因;因;因;因9595首同时出首同时出首同时出首同时出现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方中有中有中有中有9292首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述规则的置信度为规则的置信度为规则的置信度为规则的置信度为96.84%96.84%。因茯苓出现的概。因茯苓出现的概。因茯苓出现的概。因茯苓出现的概率率率率43%43%,则提升度为,则提升度为,则提升度为,则提升度为2.24.2.24.分类关联规则分类关联规则举例举例n n例如:桂枝例如:桂枝例如:桂枝例如:桂枝*生姜生姜生姜生姜*白芍白芍白芍白芍寒证寒证寒证寒证 (supsup=5.6%5.6%,conf=60%conf=60%,lift=1.71,lift=1.71)n n 仲景方共仲景方共仲景方共仲景方共268268首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为1515,桂枝、生姜、,桂枝、生姜、,桂枝、生姜、,桂枝、生姜、白芍三味药同时出现在仲景方中的频数为白芍三味药同时出现在仲景方中的频数为白芍三味药同时出现在仲景方中的频数为白芍三味药同时出现在仲景方中的频数为2525,寒证出,寒证出,寒证出,寒证出现的概率现的概率现的概率现的概率=35%=35%,则上述规则的,则上述规则的,则上述规则的,则上述规则的支持度支持度支持度支持度为:为:为:为:15/268=5.6%15/268=5.6%;置信度置信度置信度置信度为:为:为:为:15/25=60%15/25=60%;提升;提升;提升;提升度为:度为:度为:度为:60%/35%=1.7160%/35%=1.71。n n若系统设置若系统设置若系统设置若系统设置最小支持度阈值最小支持度阈值最小支持度阈值最小支持度阈值为为为为5%5%,最小置信度阈值最小置信度阈值最小置信度阈值最小置信度阈值为为为为50%50%,则该规则将作为发现的有趣模式(用药配伍,则该规则将作为发现的有趣模式(用药配伍,则该规则将作为发现的有趣模式(用药配伍,则该规则将作为发现的有趣模式(用药配伍规律)反馈给用户。规律)反馈给用户。规律)反馈给用户。规律)反馈给用户。参数计算样例参数计算样例ID麻黄麻黄桂枝桂枝白芍白芍白白术术干姜干姜111100211101310011401111511011麻黄麻黄桂枝桂枝sup=sup=?;conf=;conf=?;lift=;lift=?目录目录n n解决的问题n n关联规则相关理论基础n nSPSS CLEMENTINE中实现的关联规则挖掘算法数据格式需求数据格式需求模型建立与参数设置模型建立与参数设置n n案例:仲景方配伍规律挖掘数据格式需求数据格式需求表格格式表格格式 ID半夏半夏厚朴厚朴茯苓茯苓生姜生姜干干苏叶叶麻黄麻黄019111110020100001ID方名方名出出处组成成019半夏厚半夏厚朴朴汤金金匮要略要略半夏一升半夏一升 厚朴三两厚朴三两 茯苓四两茯苓四两 生姜五两生姜五两 干干苏叶二两叶二两020半夏麻半夏麻黄丸黄丸金金匮要略要略半夏等分半夏等分 麻黄等分麻黄等分数据格式需求数据格式需求交易格式交易格式 IDIndex1019半夏半夏019厚朴厚朴019茯苓茯苓019生姜生姜019干苏叶干苏叶020半夏半夏020麻黄麻黄n n目前通常收集的数据格式目前通常收集的数据格式n nCLEMENTINE中实现的关中实现的关中实现的关中实现的关联规则挖掘算法需要的格式联规则挖掘算法需要的格式联规则挖掘算法需要的格式联规则挖掘算法需要的格式ID方名方名出出处组成成019半夏厚半夏厚朴朴汤金金匮要略要略半夏一升半夏一升 厚朴三两厚朴三两 茯苓四两茯苓四两 生姜五两生姜五两 干干苏叶二两叶二两020半夏麻半夏麻黄丸黄丸金金匮要略要略半夏等分半夏等分 麻黄等分麻黄等分模型建立与参数设置模型建立与参数设置n n仲景方数据集n n运行CLEMENTINEn n建立数据流n n参数设置数据流数据流数据源节点数据源节点类型节点类型节点模型节点模型节点fields标签标签模型节点模型节点model标签标签目录目录n n解决的问题解决的问题n n关联规则相关理论基础关联规则相关理论基础n nSPSS CLEMENTINESPSS CLEMENTINE中实现的关联规中实现的关联规则挖掘算法则挖掘算法n n案例:仲景方配伍规律挖掘案例:仲景方配伍规律挖掘 问题问题 仲景方数据集仲景方数据集 仲景方数据预处理仲景方数据预处理 仲景方配伍规律挖掘仲景方配伍规律挖掘事务格式事务格式数据流窗口数据流窗口数据源节点数据源节点类型节点设置类型节点设置模型节点设置模型节点设置结果节点结果节点分析结果分析结果问题问题n n仲景方,即张仲景所创方剂,因其配伍严谨、疗效卓著,被后世尊奉为经方。n n总结张仲景的用药配伍规律n n分别从八纲中的寒、热、虚、实;病位中的表里、五脏六腑、六经、仲景方出处等角度分别总结张仲景治疗寒、热、虚、实等诸证的遣方用药规律。仲景方数据集仲景方数据集n n选择张仲景所著选择张仲景所著伤寒论伤寒论中方剂中方剂113113首,首,金匮要略金匮要略中方剂中方剂205205首,共首,共318318首方剂,首方剂,构建了含构建了含“IDID、方名、出处、功效、主治、方名、出处、功效、主治、药物组成药物组成”等字段的仲景方数据集。等字段的仲景方数据集。n n查看查看伤寒论伤寒论、金匮要略金匮要略原始数据原始数据n n查看仲景方数据集查看仲景方数据集 仲景方数据预处理仲景方数据预处理空缺值处理空缺值处理中药名规范化中药名规范化药物组成结构化药物组成结构化方剂排重方剂排重方剂归类与结构化方剂归类与结构化格式转换格式转换仲景方数据预处理仲景方数据预处理空缺值处理空缺值处理删删除无除无药药物物组组成等信息的方成等信息的方剂剂7首,余首,余311首方首方剂剂ID方名出处功效主治药物组成081附子汤金匮要略温阳散寒,暖宫安胎妊娠阳虚寒盛腹痛证249文蛤散伤寒论n n查看原始数据查看原始数据仲景方数据预处理仲景方数据预处理中药名规范化中药名规范化n n规范化规范化 “药物组成药物组成”字段中的中药名字段中的中药名 删除已不再使用的删除已不再使用的2929味药物,如味药物,如 “白鱼白鱼”、“鸡鸡屎白屎白 ”;更改更改1717味中药的名称,如味中药的名称,如“柏叶柏叶”改为改为“侧柏叶侧柏叶”;处理同药异名,处理同药异名,“赤硝赤硝”、“芒硝芒硝”、“硝石硝石”规规范使用药名范使用药名“芒硝芒硝”;处理同名异药,如处理同名异药,如“芍药芍药”拆分为拆分为“白芍白芍”与与“赤芍赤芍”。经中药名规范化后,仲景方药物组成中涉及经中药名规范化后,仲景方药物组成中涉及经中药名规范化后,仲景方药物组成中涉及经中药名规范化后,仲景方药物组成中涉及的药物由的药物由的药物由的药物由172172味变为味变为味变为味变为132132味。味。味。味。n n查看原始数据查看原始数据仲景方数据预处理仲景方数据预处理药物组成结构化药物组成结构化IDID方名方名方名方名药药物物物物组组成成成成001001白虎加桂枝白虎加桂枝白虎加桂枝白虎加桂枝汤汤知母六两知母六两知母六两知母六两 甘草二两甘草二两甘草二两甘草二两 石膏一斤石膏一斤石膏一斤石膏一斤 粳粳粳粳米二合米二合米二合米二合 桂枝三两桂枝三两桂枝三两桂枝三两002002白虎加人参白虎加人参白虎加人参白虎加人参汤汤知母六两知母六两知母六两知母六两 石膏一斤石膏一斤石膏一斤石膏一斤 甘草三两甘草三两甘草三两甘草三两 粳粳粳粳米六合米六合米六合米六合 人参三两人参三两人参三两人参三两IDIDIDID方名方名方名方名组组组组成成成成知知知知母母母母甘甘甘甘草草草草石石石石膏膏膏膏粳粳粳粳米米米米桂桂桂桂枝枝枝枝人人人人参参参参001001001001白虎加白虎加白虎加白虎加桂枝桂枝桂枝桂枝汤汤汤汤1 1 1 11 1 1 11 1 1 11 1 1 11 1 1 1002002002002白虎加白虎加白虎加白虎加人参人参人参人参汤汤汤汤1 1 1 11 1 1 11 1 1 11 1 1 11 1n n查看原始数据查看原始数据仲景方数据预处理仲景方数据预处理方剂排重方剂排重n n方剂排重的原则方剂排重的原则 如果两首方剂药物组成相同,且各药物用量如果两首方剂药物组成相同,且各药物用量比例相同,就可以判为相同方剂。比例相同,就可以判为相同方剂。使药剂量的少许差异不会导致两首方剂功效、使药剂量的少许差异不会导致两首方剂功效、主治的差异,因此仍然能判断为相同方剂,主治的差异,因此仍然能判断为相同方剂,如如“姜、草、枣姜、草、枣”一类作为一类作为“使使”药使用时,药使用时,少许用量差异则忽略不计。少许用量差异则忽略不计。n n排除重复方剂排除重复方剂4343首,余首,余268268首方剂。首方剂。n n查看原始数据查看原始数据仲景方数据预处理仲景方数据预处理方剂归类方剂归类n n分别从病性分别从病性(寒热虚实寒热虚实)、病位、病位(五脏六腑五脏六腑)、六经、六经、出处出处(伤寒、金匮伤寒、金匮)等角度对仲景方进行归类等角度对仲景方进行归类方名功效主治 根据所治疾病的性质归类根据所治疾病的部位归类根据所治疾病的病变过程归类根据方剂出处归类白虎加桂枝汤清里热,解外寒温疟热、寒表里金匮白术散辛寒清热阳明病表里俱热证虚、寒脾胃金匮白通加猪胆汁汤通阳行水化湿阳虚风湿湿重证虚、寒心少阴病伤寒n n查看原始数据查看原始数据仲景方数据预处理仲景方数据预处理方剂归类结构化方剂归类结构化ID 方名根据所治疾病的性质归类寒热虚实001白虎加桂枝汤热、寒寒热002白虎加人参汤热热004白虎汤热热006白术散虚、寒寒虚007白通加猪胆汁汤虚、寒寒虚008白通汤虚、寒寒虚n n查看原始数据查看原始数据格式转换格式转换n n挖掘的主题张仲景主治寒热证的用药规律张仲景主治寒热证的用药规律n n数据集成集成集成“药物组成结构化药物组成结构化”&“方剂归类结构方剂归类结构化化”调整数据分组调整数据分组n n结构化转换为三元组方式仲景方配伍规律挖掘仲景方配伍规律挖掘n n关联规则挖掘n n分类关联规则挖掘模式评估模式评估n n(1)挖掘出的关联规则和分类关联规则可以作为专业领域内已公认知识的佐证。n n(2)有些模式的价值目前尚不能得到认可,可以通过文献考证、专家认可、临床或试验等来确认模式的有效性。试验考核内容试验考核内容 3月月21日之前交报告日之前交报告n n仲景方用药关联规则的挖掘n n仲景方用药分类关联规则挖掘寒、热、寒热错杂寒、热、寒热错杂虚、实、虚实错杂虚、实、虚实错杂
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服