资源描述
改良马氏深度函数法建立多元参考值范围的
理论与应用
作者:薛富波王玉琨徐勇勇
【摘要】 目的:提出一种基于改良马氏深度函数的多变量参
考值范围统计学建立方法,并以此为基础探讨统计深度函数在解决多
变量参考值范围问题方面的实际应用价值.方法: 采用计算机模拟试验
和实际数据分析相结合的方式,从参考值范围几何特征、参考值范围
合法性与有效性等方面对新的和现有的几种多变量参考值范围建立方
法进行比较分析.结果: 改良马氏深度法建立的二元参考值范围具有典
型的中心椭圆特征,对于多元正态分布资料,改良马氏深度法与正态
分布法一致性在 98.5%以上,实例数据分析结果显示改良马氏深度法
建立的参考值范围大小比多元正态分布法更接近理论水平.结论: 改良
马氏深度法在参考值范围几何特征方面符合要求,在合法性及有效性
方面优于现有的成熟方法,可以作为多变量参考值范围的有效统计学
建立方法.
【关键词】参考值计算机模拟试验深度函数统计学方法
0 引言
医学多变量参考值范围统计学建立方法是困扰医学统计工作者的
重要问题之一.目前的多变量参考值范围多采用多次重复使用单变量
参考区间的方法,但此方法的主要问题之一是无法处理变量间相关性
的影响.针对多元正态分布资料,多元正态分布法仍是最有效的方法
1
[1] 而近年来有关学者提出的多指标百分位数法 2]
, [ 和全息元法 3] [
等在探索针对其它类型资料的多变量参考值范围建立方法方面做出了
有益的尝试.
统计深度函数是针对多元数据的基于空间排列的一种顺序统
计量,具有明显的非参数特性,可作为医学多变量参考值范围统计学
方法的一种选择.为探讨统计深度函数在多变量参考值范围统计学方
法上的应用价值,本研究提出一种基于改良马氏深度函数的多变量参
考值范围统计学建立方法,并通过模拟试验和实例数据分析探讨该方
法的实际应用价值.
1 材料和方法
1.1 材料本研究实例数据资料来源于 2001 年某省健康青年体检数
据.其中包含 3453 例受测者, 全部为男性, 年龄 14.5~29.5 平均 18.41 (
±1.01)岁.数据包括血压、体型和体能等三类多元指标.其中血压指
标包括收缩压和舒张压 2 个变量;体型指标包括身高、坐高、肩宽、
体质量、胸围、腰围、臀围等 7 个变量;体能指标包括肺活量、立定
跳远距离、俯卧撑次数以及仰卧起坐次数等 4 个变量.
1.2 方法
1.2.1 改良马氏深度函数方法设计统计深度函数用以计算多元数
据基于空间排列的秩次以及各种顺序统计量[4].本研究以马氏深度
函数[4]为基础,经过适当的改良后,将其应用于多变量参考值范围
统计学建立方法.其改良方法如下.
从提高马氏深度函数稳健性考虑,对其进行以下操作:在进行空
2
间排列顺序计算前,先对原始变量进行标准化,使各变量具有相同的
变异程度;以中位数向量为位置参数;以 Spearman 秩相关矩阵为变异
矩阵.改良马氏深度函数可表达为式(1)的形式.
MDS(x,F)=[1+(xs-Mds)′R-1s(xs-Mds)]-1(1)
其中,xs 表示各分量经标准化后的数据向量,Mds 表示各分量经
标准化后的中位数向量,Rs 表示原始样本数据的 Spearman 秩相关矩
阵.
改良马氏深度法建立多变量参考值范围的主要操作步骤如下:①
应用改良马氏深度函数将多元数据类型的参考样本转化为统计深度指
标,实现多元数据向单变量数据的转换; ②采用百分位数法建立
统计深度指标的指定容量的单侧参考值区间(右侧区间,包括中心点
对应的统计深度最大值) ; ③对于新样品,先依据参考样本的中位
数向量和秩相关矩阵计算其对应的统计深度,并依据上述统计深度单
侧参考值区间判断其正、异常分类.
1.2.2 运算环境与分析方法本研究的全部分析计算过程均在
SAS9.1 软件环境下通过编程方法完成.将从参考值范围空间几何特
征、参考值范围一致性以及实例分析等方面对改良马氏深度法和现有
的几种方法(多元正态分布法、多指标百分位数法、全息元法)进行
对比分析,以考察改良马氏深度法的优缺点及其实际应用价值.
参考值范围空间几何特征分析以计算机模拟数据为基础,为
简便操作仅从二元正态分布资料参考值范围的几何分布形态入手进行
探讨.具体操作为: 对二元正态分布的模拟数据建立多变量参考值范 针
3
展开阅读全文