1、多元统计分析方法在中药质量评价中的应用【关键词】 多元摘要:介绍了各种多元统计分析方法的基本原理及其在中药质量评价中的应用进展。关键词:中药;质量评价;多元统计分析我国中药材资源丰富,种类繁多,来源复杂,品种混乱,同物异名,同名异物现象多见。商品市场上除正品外,尚有代用品、伪品和混淆品,来源不同的药材,质量差异很大,势必影响临床的疗效,所以对中药质量的评价尤为重要。过去基本上是以传统的性状鉴定和显微鉴定确定真伪,以理化鉴定评价优劣。近年来发展起来一种新的技术模式识别,它是根据物质所含的化学成分,利用TLC、UV、IR、HPLC、GC、MS等方法获得其化学数据,然后利用数学思想和方法对该类数据进
2、行特征提取,对药材进行分析、决策和判断。此种方法迅速发展,逐渐取代了传统的中药材鉴定法。模式识别所用的方法较多,但最常用的为统计学方法,它是以数学上决策理论为基础,建立统计学识别模型,找出规律性认识。1 多元统计分析方法在中药质量评价中的应用11 聚类分析在中药质量评价中的应用聚类分析法是数值分类学的新的分支,它是对一组尚无明确分类的样本,根据它们所表现的变量特征,按相似程度的大小加以归类,其目标是在模式空间中找到客观存在的类别。按聚类目的不同,可将聚类分析法分为R型聚类法和Q型聚类法。其原理为:对任一含m个指标的样本,可定义为m维空间的点,在m维空间中的任意两点其相似性可用“距离”度量,定义
3、为“dij”,若将任一样本看作一类,其类间相似性可用欧氏距离DE表示: DE=dij=m i=1(xil-xjl)21/2,式中:l=1,2, m,表示样本的指标数;i,j表示样本序号;xil,xjl表示样本各指标。系统聚类法即对n个样本计算出两两间的距离dij,并从中找出距离最小的两类Gp与Gq,合并成一个新类Gr,重新计算新类与其他各类间的距离,再将距离最小的两类合并,重复以上过程至所有样本聚为一类为止。定义类Gk与Gr的距离Drk有以下递推公式:D2rk =pD2pk+qD2qk+D2pq+|D2pk-D2qk|,式中参数p,q,取值不同对应不同的系统聚类方法。该法除常用于中药系列品种的
4、分类外,还可以广泛的引用于真伪鉴别、成分浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面17,使中药研究跨进现代电脑量化分析的新阶段。马英丽等8用甲醇回流提取黄芪中的皂苷类成分,以氯仿甲醇水为展开剂,采用双波长薄层扫描法,在s=390nm,r=590nm下,对18个产地的黄芪样品进行了定量分析,以黄芪甲苷为指标成分,选用中位数法进行聚类,用余弦法计算样品间的相似性程度。结果系统聚类分析将样品分为3类,大多数产地的黄芪被聚为1类或2类,即质量较好或一般。表明,蒙古黄芪和膜荚黄芪被列为优质品,该结果与中华人民共和国药典2000年版将蒙古黄芪和膜荚黄芪列入正品相一致。王继
5、国等9建立了10种中药血竭样品的HPLC指纹图谱,并把HPLC指纹图谱信息进行数据化及数据标准化处理,用重叠率与相关系数两个参数,从两个方面定量的对这10种样品的HPLC指纹图谱进行了相似性评价;在此基础上用系统聚类分析法定性的对这10种样品进行了分类和鉴别,从而建立了一种相对完善的中药血竭的化学模式识别技术,为中药血竭的质量评价和分类鉴别提供了一个很好的方法和思路。田兰等10采用HPLC对32个白术样品进行测定,将样品分析中所获得的32个样品的45个特征,采用系统聚类分析和逐步判别分析,进行白术的化学模式识别的研究。将32个样品分为优等品、一般品和伪品3个等级,优质品集中于浙江、湖南、四川一
6、带,而北方的白术质量一般。这样就建立了评价白术真伪优劣的新方法。徐永群等11以赤芍的红外指纹图谱为依据,采用主成分分析法对来自18个产地的赤芍进行了聚类分析。可将18个产地大致分为6类,这一分类与地理位置有较明显的对应关系,同一区域内赤芍的性能较为相似,可作为传统中医界对赤芍药材质量评价的依据。刘谦光等12 运用模糊动态聚类分析法对来源于美国、加拿大及我国的共14种不同产地的西洋参样品质量进行了模糊识别研究。结果与权威部门认定的具有法定地位的西洋参产地进行验证、核对,取得了较为一致的结果。12 判别分析在中药质量评价中的应用判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已
7、知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类,而聚类分析是在一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型。正因为如此,判别分折和聚类分析往往联合起来使用,所以判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。于承浩等13对六味地黄丸及其模拟样品在290nm下进行薄层扫描分析,将所得特征数据利用聚类分析方法进行分类,用逐步判别分析方法优选特征数据、建立判别函数,并对分类结果进行检验。结果表明,样品及模拟品被分为4类,分类合
8、理,判别函数回判准确率为100%。从而说明了聚类判别分析方法可较好地评价六味地黄丸的质量。张亮等14采用反相HPLC法对六味地黄丸缺味药模拟方的浸出物进行分析,选取9个色谱峰的峰面积与内标峰面积之比值作为样本特征变量,通过169个训练集样本建立了其中3种缺味药的Bayes法和PRIMA法判别分析数学模型。结果3种缺味药4种模式的平均正确识别率Bayes法和PRIMA法均为100%,对169个预示集样本的平均预示率Bayes法为100%,PRIMA法为%。表明Bayes法和PRIMA法能对六味地黄丸3种缺味药进行准确识别。13 主成分分析法在中药质量评价中的应用根据在初选的特征量间可能存在的相关
9、性,找到一种空间变换方式,通过对原始特征变量进行线性组合,形成若干个新的特征矢量,要求它们之间相互正交,它既保留了原始指标的主要信息,且又互不相关。这样一种从众多原始指标之间相互关系入手,寻找少数综合指标以概括原始指标信息的多元统计方法成为主成分分析。其数学模型为:设有m个指标X1,X2,Xm,欲寻找可以概括这m个指标主要信息的综合指标Z1,Z2,Zm。从数学上讲,就是寻找一组常数ai1,ai2,aim,使这m个指标的线性组合:Z1=a11 X1a12 X2a1m XmZ2=a21 X1a22 X2a2m Xm Zm=am1 X1am2 X2amm Xm能够概括m个原始指标X1,X2,Xm的主
10、要信息(其中,各Zi互不相关)。这些矢量即称为主成分。该方法就是根据样本特点,选取与问题最相关的特征来参与分类的。近年来主成分分析法在中药质量鉴别分析中应用比较广泛15-17。张耀奇等18运用气相色谱法结合主成分分析对16种苍术及类似品、30种相关成药进行了研究。该方法是将气相色谱分离得到去除杂质峰的整个色谱图化分成237个时间通道,凡在时间通道内不出峰就以“0”表示,出峰的以实际峰面积表征。由此,每一样本均可用一个237维的向量表示,采用shannon信息量方程计算每一时间通道的信息量,最后选取信息量最大的十几个通道作为分类特征。结果显示,苍术和白术有明显区别;茅苍术和北苍术虽为药典规定的正
11、品苍术,但就挥发性化学成分来看,两者有明显区别;北苍术和关苍术区别不大。三种相关成药,以三妙丸较有特征,有别于其它两种。孙红祥等19从常用的10种天南星药材中选取与抗肿瘤、镇咳祛痰作用相关的13种成分作为评价指标,并运用主成分分析方法从这13个指标中提取了4个主因子,其累积贡献率达,能较近似的代表原始数据所反映的信息,得到权重系数较大的X1、X2、X4、X7、X8、X11和X12等7个指标,然后再采用模糊数学的方法对这些药材的质量进行综合评价。结果表明,一把伞南星最佳,其次为象头花和掌叶半夏,粗序南星质最劣。因此,应用主成分分析和模糊数学方法建立的数学模型进行中药材的质量评价是可行的。马龄等2
12、0采用气相色谱法对中药吴茱萸脂肪酸进行了分析测定,根据测定的数据用主成分分析法进行特征压缩、提取,将代表诸样品特征的点即“星”显示在半圆形极坐标上构成星座图,根据“星”所属的星座和所走的路径,对18种不同品种、不同产地的吴茱萸进行自然分类,为中药吴茱萸的品种鉴别和质量优选提供了依据。张亮等21利用主成分分析法对32个不同品种来源的中药石斛样品质量进行了研究,该法直接用药材粉末的氯仿浸出液的紫外光谱数据进行分析,以每一波长与特定波长的吸光度比值作为分类指标,用Shannon信息理论对全部样品计算每一波长通道的信息量,选取信息量最大的10个通道用作分类特征,取得了满意的分类结果,为从化学角度研究中
13、药质量提供了一种新的方法。曾明等22应用主成分分析法对来源于不同产地的野葛及葛属的其它8种植物进行了化学模式识别研究,为葛属植物的药材质量评价及分类提供了依据。王秀坤等23运用主成分分析法及非线性映射技术,对来源于全国各地的40份苦参药材质量进行了化学模式识别研究,取得了与传统鉴定较为一致的结果。14 逐步回归分析在中药质量评价中的应用逐步回归分析24是进行双向筛选的一种方法,当引入一个自变量进入方程后,要对方程中的每一个自变量作基于偏回归平方和的F检验,看是否需要剔除一些退化为“不显着”的自变量,以确保每次引入新变量之前方程中只包含有“显着”作用的自变量。这一双向筛选过程反复进行,直到既没有
14、自变量需要引入方程,也没有自变量从方程中剔除为止,从而得到一个局部最优的回归方程。到目前为止,此种方法在中药质量评价中应用的比较少。张汉明等25为了考察化学成分与药理活性之间的内在联系,建立合理的化学模式识别方程,因此选择了葛根的有效成分总黄酮、葛根素、大豆苷元、大豆苷、3甲氧基葛根素及多糖的含量和葛根清热解表功效有关的抗内毒素活性强度为化学和药理指标,运用逐步回归法建立了回归方程,同时采用Bayers判别分析法对来自全国不同产地的葛根及同属的其它植物进行了模式识别研究。结果黄酮类成分未进入方程,而多糖与抗内毒素活性呈显着的负相关;6因素和单因素的判别正确率分别为、。本研究也为中药材质量评价提
15、供了一个新的依据。15 典型相关分析在中药质量评价中的应用典型相关分析是研究变量之间相关关系的一种统计分析方法,它揭示两组随机变量之间的线性相关情况。是从整体上把握两组指标之间的相互关系,分别在两组变量中提取有代表性的两个综合变量U1、V1,利用这两个综合变量之间的相关性在一定程度上反映了原来两组指标之间的整体相关性。孙立新等26收集不同科属、不同产地的板蓝根样品27个、大青叶样品5个。对样品的化学成分进行高效液相色谱分析,获得反映样品整体化学特征的数据,同时选择体外抑菌药理指标进行药理活性测定。用典型相关分析揭示了化学信息和药理指标之间的相关关系,寻找与药理指标密切相关的化学成分,用ISOD
16、ATA聚类分析技术将32个样品划分为5类。结果用此方法评价板蓝根、大青叶的质量,结果良好,正确率为906。2 小结多元统计分析方法运用在中药质量评价中,具有较强的科学性,在鉴定中药的真伪和质量优劣方面的研究工作已取得了可喜的进展,但现在多以单一方法为主,这样不容易把样品的特征信息完全表现出来。所以应该使多种统计方法联合运用,从而更可观的反映中药的质量,以达到中药质量全面控制的目的。相信多元统计方法会成为中药质量评价的一种科学的、全面地、准确的方法。参考文献1 马英丽, 赵怀清, 王学娅, 等. 不同产地黄芪的系统聚类分析. 中医药学报, 2003,31(2):2021.2 崔淑芬, 蒋轶伦,
17、王小如. 甘草药材薄层扫描指纹图谱研究. 沈阳药科大学学报, 2004,21(5):367370.3 王玺, 周密. 气相色谱数据的聚类分析法评价中药厚朴的质量. 沈阳药学院学报, 1990,7(1):57.4 戴荣华, 马英. 牛膝质量评价方法研究中的化学模式识别. 计算机与应用化学, 2002,19(3):255256.5 徐永群, 孙素琴, 冯学峰, 等. 黄芩产区红外指纹图谱和聚类分析法的快速鉴别研究. 光谱学与光谱分 析, 2003,23(3): 502505.6 刘荣霞, 周婷婷, 董婷霞, 等. 建立评价当归质量的HPLC指纹图谱分析方法. 中国药学杂志, 2003,38(10)
18、:757760.7 王艳华, 李莉. 中药半夏的化学模式识别研究. 黑龙江医药, 2004,17(5):342343.8 马英丽, 赵怀清, 田振坤, 等. 黄芪质量的化学模式识别研究. 中草药, 2003, 34(5):460462.9 王继国, 雍克岚, 陈旭, 等. 中药血竭的化学模式识别研究. 上海大学学报(自然科学版), 2004,10(1):7578.10 田兰, 毕开顺, 孙稳健, 等. 白术的化学模式识别. 中国中药杂志, 2003,28(2):143146.11 徐永群, 黄昊, 周群. 红外指纹图谱和聚类分析法在赤芍产域分类鉴别中的应用. 分析化学. 2003,31(1):
19、59.12 刘谦光, 陈战国, 张尊听, 等. 西洋参质量的化学模式识别. 中草药, 1999,30(11):852853.13 于承浩, 吕青涛, 王晶. 聚类判别分析方法评价六味地黄丸质量的研究. 山东中医药大学学报, 2002,26(5):375378.14 张亮, 刘展鹏, 杨春. 六味地黄丸缺味药的Bayes法和PRIMA法定性识别研究. 中国中药杂志, 2000,25(1):2932.15 周永治, 郭戎. 主成分分析法在中药鉴别中的应用. 生物数学学报, 1995, 10(3):200204.16 苏薇薇, 梁仁, 黄韬. 黄芩中微量元素的模糊数学处理及正品黄芩的识别. 广东微量
20、元素科学, 1997, 4(2):6063.17 苏薇薇. 主成分分析法评价中药材黄芩的质量. 现代应用药学. 1990, 7(4):911.18 张耀奇, 潘扬, 王天山, 等. 术类中药及其相关成药质量的主成分分析. 南京中医药大学学报, 1997, 13(3): 149150.19 孙红祥, 叶益萍. 天南星类药材的综合质量评价. 生物数学学报, 2003, 18(2): 243248.20 马龄, 王玺. 中药吴茱萸中脂肪酸气相色谱数据的化学模式识别. 计算机与应用化学, 2000, 17(1):123.21 张亮, 马国祥, 张正行, 等. 中药石斛质量的化学模式识别. 药学学报,
21、1994, 29(4):290295.22 曾明, 张汉明, 郑水庆, 等. 中药葛根及同属植物的化学模式识别. 中草药, 1998, 29(10):652654.23 王秀坤, 李家实, 魏璐雪, 等. 苦参质量的化学模式识别. 中国中药杂志, 1996, 21(4):198200.24 孙振球. 医学统计学. 第1版. 北京: 人民卫生出版社, 2002, 249251.25 张汉明, 曾明, 郑水庆, 等. 中药葛根及同属植物的模式识别研究. 中草药, 2001,32(3):253254.26 孙立新, 宁黎丽, 毕开顺. 板蓝根和大青叶质量的化学模式识别研究. 中药材, 2000,23(10):609613.