资源描述
医学统计学课程模拟试卷:
一. 名词解释
1. Population and Sample
总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体。
样本:从总体中随机抽取的部分研究对象
2. Average
平均数:一类用于描述数值变量资料集中趋势的指标,常用的有算术平均数、几何平均数、中位数、百分位数和众数。
3. Sampling Error
抽样误差:由个体变异产生的、随机抽样引起的统计量与总体均数之间的差异。
4. Reference Ranges
医学参考值范围:特定的正常人解剖、生理、生化指标及组织代谢产物含量等数值中大多数个体取值的所在范围。
5. Statistical Inference
统计推断:从总体中随机抽取一个样本,用样本的信息去推断总体的特征,这种研究方法就叫做统计推断。
二.选择题
1、 分析母亲体重与婴儿的出生体重的关系,宜绘制 ( C )
A. 直方图 B. 圆图
C. 散点图 D. 直条图
2、统计推断包括( D )
A、 统计描述 B、参数估计 C、估计抽样误差 D、 参数估计和假设检验
3、两样本率比较,经χ2检验,差别无显著性时,P值越大,说明( B )
A.两样本率差别越大 B.两总体率相同的可能性越大
C.越有理由认为两总体率不同 D.越有理由认为两样本率不同
4、调查某地1000人,记录每人的血压值,所得的资料是一份( A )。
A、计量资料 B、计数资料 C、还不能决定是计量资料还是计数资料 D、可看作计量资料,也可看作计数资料
5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、 c2检验 B、 u检验
C、 校正c2检验 D、 确切概率法
c2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
校正c2检验:1<T<5,n>=40
6、 若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。
A、 30 B、 29 C、 28 D、 27
n1+n2-2
7、某项关于某种药物的广告声称:“在服用本制剂的1000名上呼吸道感染的儿童中,有970名儿童在72小时内症状消失。”因此推断此药治疗儿童的上呼吸道感染是非常有效的,可以推广应用。这项推论是( C )。
A.正确 B.不正确,因所作的比较不是按率计算的
C.不正确,因未设对照组或对比组 D.不正确,因未作统计学假设检验
8、两个小样本计量资料的比较,首先应考虑( D )。
A.用t检验 B.用秩和检验
C.t检验或秩和检验均可 D.资料符合t检验还是符合秩和检验的条件
t检验:
单一总体t检验时,要求样本相应的总体为正态总体
配对t检验时,要求每对数据差值的总体为正态总体
两样本t检验时,要求相应的两总体为正态总体且两总体方差相等,即方差齐性;如果方差不齐,则采用t’检验
秩和检验:非正态总体
9、测定某地130名正常成年男子血脂,要估计该地成年男子血脂均数的95%可信区间是:( B )
A. B. C. D.
10、四格表中四个格子基本数字是 C
A. 两个样本率的分子和分母 B.两个构成比的分子和分母
C. 两对实测阳性绝对数和阴性绝对数
D. 两对实测数和理论数
三.简述题与问答题
6. 简述医学统计中三种主要平均数的适用范围和条件
算术平均数:适用于对称分布的资料,尤其是正态分布或近似正态分布的资料。
几何平均数:适合于观察值变化范围跨越多个数量级的资料,尤其是对数正态分布料。
中位数:各种分布类型的资料,特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。
众数:适用于大样本。
7. 简述假设检验中的两类错误和检验效能
I类错误:拒绝正确的无效假设,用a表示,称为检验水准。
II类错误:接受错误的无效假设,用B表示。
检验效能:统计学中用1-B表示,其意义是当两个总体存在差异时,使用统计检验发现两个总体差异的能力,通常检验效能在0.8左右。
8. 观察30名贫血患者用铁剂治疗后红细胞增加数,其总体的同质基础是什么?如何描述治疗后红细胞增加数分布的变异程度。
同质基础:贫血患者和铁剂治疗
如何描述:用标准误来描述。描述一组同质变量值分布的变异程度:可以采用标准误这个指标,反应的是随机抽样引起的统计量与总体参数,统计量与统计量之间的差异。
9. 下面的回归方程来自对16个诊断为糖尿病患者的研究,他们接受某种治疗已一年
(Y是病人开始治疗之后一年里所减轻的体重,X是病人治疗开始时的体重。)
请在这项研究资料的基础上做出合理的解释。
从预测的角度,通过样本数据在最小二乘法原则下建立线性回归方程,以便用自变量(X)的数值估计反应变量(Y)的数值及变异。-34代表在没有自变量x影响时,其他各种因素对因变量Y的平均影响;0.29代表自变量x每改变一个单位,Y便改变0.29个单位。用于预测时候,必须是在X的取值范围内。
10. 某地抽样调查了10000名正常成人男性的血压值(近似正态分布)。结果如下
收缩压的均数=110,标准差=11,舒张压的均数=73,标准差=11 (单位:mmHg)
问:(1)从中随机抽取一人,测的其舒张压在73±1.96×11这一范围内的可能性为多少 95% 99%===2.58
(2)若以舒张压≥95为高血压,试按正态分布原理估计这10000人的高血压患病率约为多少?
1- Ѡ(95-73 /11)=1-Ѡ(2)=2.28%
(3) 试以95%的概率估计当地全体成年人收缩压均数的范围。 110±1.96×11
(4) 试比较样本收缩压与舒张压的变异程度是否相同?为什么
不同,算CV,收缩压CV=10.00%,舒张压CV=15.07%。
变异系数CV=S/(X的平均值)*100%,用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。
11. 血铅浓度升高可能与肾功能不全有关。54名血清尿素升高的病人及按年龄、性别配对的54名对照者的血铅均数、中位数和众数如下:
集中趋势的指标(μmol/L)
血清尿素升高的对象
对照者
均数
1.73
1.33
中位数
1.44
1.31
众数
1.25
1.25
(1)这两组集中趋势指标告诉我们这两个分布呈什么形状?
血清尿素升高的对象是正偏态分布,对照组是正态分布。
(2)如何比较两组间平均血铅的差异?用什么方法?
符号秩检验:检验配对数据的差值是否来自具有相同分布的总体。
四.分析题
血压有时升高有时正常的病人引起一个复杂的问题。研究对象是男人,它们至少有一次收缩压超过140mmHg或舒张压超过90mmHg,并且在多次看门诊时至少有一次读数在140/90mmHg以下。以年龄相仿而血压从未超过140/90mmHg的男人为对照组。高血压组中找出了一个亚组,这个亚组是由在家测量的血压转为正常的男人组成的。我们的兴趣在于确定非稳定型高血压病人可用以与血压正常者相鉴别。
(1) 将下表的各项测量值算出95%可信区间。
不同血压分组对象的临床特征
(均值或比例±SE)
特 征
门诊检查正常者
(N=49)
门诊检查可疑
在家正常者
(N=31)
体重(公斤)
70.6±1.5
81.3±1.9
心率(每分钟心跳数)
70.9±1.4
83.1±2.1
家族史阳性(%)
24.4±6.1
41.9±8.9
可信区间:X一把加减1.96*SE
(2). 你认为哪些特征的差异太大因而不能单纯用“抽样误差”来解释?为什么?
下列规则用于确立哪些可疑高血压病例可以认为是在家时读数正常的人。当某人在家读数与那些门诊收缩压与舒张压正常者(对照组)在家读数的均数相比,不超过一个标准差者,则将他分到在家读数正常组中。
(3).此规定的理论根据是什么?
分析:
(1) 各组的95%CI计算如下:
特 征
门诊检查正常者
(N=49)
门诊检查可疑
在家正常者
(N=31)
体重(公斤)
67.66-73.54
77.58-85.02
心率(每分钟心跳数)
68.16-73.64
78.98-87.21
家族史阳性(%)
12.44-36.36
24.95-59.34
(2) 体重与心率特征在两组间差异太大,因95%CI不重叠,所以其差异不能单纯用“抽样误差”来解释
(3) 此规定的理论依据为:根据正态分布的原理,不超过一个标准差占68.27%,因此当某人在家读数与那些门诊收缩压与舒张压正常者(对照组)在家读数的均数相比,不超过一个标准差者,则将他分到在家读数正常组中。
4
展开阅读全文