资源描述
重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(一)
一. 名词解释(15分,每题3分)
1. 样本与总体
2. 标准差与标准误
3. I类错误与II类错误
4. ±1.96s与±
5. 直线相关分析与直线回归分析
二. 选择题(只选一个正确答案或最佳答案)(30分,每题2分)
1. 某检验师测定了240例正常人白、球蛋白比例,获得的资料为___。
A、数值变量资料 B、分类变量资料 C、相对比资料
D、血清学滴度资料 E、二项分布资料
2.在正态分布曲线下,计算的概率为___________。
A. 0.500 B. 0.475 C. 0.450 D. 0.050 E. 0.010
3.某医师观察环丙沙星治疗下呼吸道感染者131例的临床疗效,结果见下表。
表1 环丙沙星治疗下呼吸道感染的临床疗效
病种
总例数
痊愈
显效
好转
无效
无效率%
肺炎
慢支炎感染
63
68
30
21
21
24
11
15
1
8
1.59
11.76
欲分析两病种疗效,应采用___________。
A. t检验 B.秩和检验 C. 方差分析 D. χ2检验 E.q检验
4. 对欲比较的样本测定资料进行参数统计假设检验的目的是____。
A.判断样本对总体是否具有代表性
B.推断各总体水平参数是否相等
C.判断表达样本平均水平的统计量有无显著性差别
D.对测定方法的精密度、准确度、灵敏度提出质控要求
E.对总体水平进行区间估计
5. 四格表中,如果有一个实际数为0 ,________________。
A . 根本不能检验 B. 就不能作检验 C. 仍然能够作检验
D. 就必须用校正检验 E . 还不能决定是否可以作检验
6. 统计假设检验中常使用P值作为推断的依据,P值的含义是____。
A.表达对比组数据来自同一总体的概率 B.表达对比组抽样误差的大小
C.表达对比组统计量不相同的概率
D.拒绝参数相等假设实际犯Ⅰ类错误的概率
E. 接受参数相等假设实际犯Ⅱ类错误的概率
7.完全随机设计方差分析中,引起数据变异的原因可能区分为___________
A.个体因素与随机(误差)因素 B.处理因素与区组因素 C.样本含量与把握度
D.处理因素与随机(误差)因素 E.个体因素与处理因素
8.方差分析的应用条件之一是方差齐性,所谓方差齐性是指__________
A.各比较组的样本方差相等 B.各比较组相应的总体方差相等
C.组内方差=组间方差 D.总方差=各组方差之和 E.各组自由度相等
9.对x,y两个变量作直线相关分析__________
A.要求x,y呈双变量正态分布 B. 只要求x服从正态分布
C.只要求y服从正态分布 D.只要求x,y是定量资料 E.对x,y无要求
10.现比较两组患者血中SOD活性的含量,(见下表),探讨两组间差别的显著性,应采用_______。
表2 两组患者血中SOD活性含量
组别
例数
SOD活性(μ/mgHb)
S
重度氟骨症
轻度氟骨症
21
12
1.78
2.38
0.33
0.25
A. B.
C. P= D. P(x)=
E.
11.欲比较丙氨酸氨基转移酶两种水平对HBeAg阴转的影响(资料见下表),应进行_____。
表3 丙氨酶氨基转移酶水平,对疗效的影响
组别
. HBeAg
+ -
≤3ULN
>3ULN
16
4
4
8
A. B. P(x)= C.
D. P= E. u=
12.某地儿童保健所拟比较含氟牙膏与一般牙膏使用者患龋率(见表4),宜进行_____。
表4 使用含氟牙膏与一般牙膏者的患龋率
牙膏类型
调查人数
患龋齿人数
患龋率(%)
含氟牙膏
200
70
35
一般牙膏
100
50
50
合计
300
120
40
A. B. r= C. a=
D. b= E. u=
13. 完全随机设计三组人群某抗体滴度资料的统计比较,应选用____。
A. B.
C. D.
E.
14. 某医师研究婴儿出生体重和双顶径的关系,收集了婴儿出生体重和双顶径的数据如下表:
表5 婴儿出生体重和双顶径的关系
体重(g)
273 299 226 315 294 260 383 273 234 329 302 357
双顶径(mm)
94 88 91 99 93 87 94 93 81 94 94 91
若要分析二者的数量关系,宜选用的方法是 。
A. B. C.
D. E.
15. 用图示法表达一组SARS病人年龄分布,宜绘制 。
A、 直条图 B、直方图 C、普通线图 D、饼图 E、散点图
三. 填空题(共15分,每空1分)
1. 反映原始测定数据对其均值离散程度的统计量用______________________,
表达样本统计量对其参数随机偏离程度的统计量是____________________。
2. 已知某医学统计资料服从正态分布,且其n=400,=30,s=5。据此可估计其中95%的数据波动范围是___________________,其总体均数95%的可信区间为____________________________。
3. 总体设计为单因素完全随机多组测定数值变量资料的统计比较,应采用___________________检验,当具有统计学意义时,再根据需要进行两两比较。这种情况,不能直接进行两两t检验,其原因是__________________________ ______________________________________。
4. 在直线回归分析中,的含义是________________________________,的含义是___________________________________________________。
5. 对一组同质的计量資料,通常可以从__________________和__________________两个方面来全面描述其数字特征。
6. 对于一份统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括 ________________、________________两方面的内容。
7. 对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有_____________、________________、________________。
四. 应用题(40分)
1. 某医师为研究肿瘤死亡与年龄的关系,收集了以下数据:
表6 某地、某年肿瘤死亡资料
年龄(岁)
人口数
死亡总数
肿瘤死亡数
肿瘤死亡/总死亡(%)
0 -
82920
138
4
2.9
20 -
46639
63
12
19.0
40 -
28161
172
42
24.4
60 -
9370
342
32
9.4
合计
167090
715
90
12.6
根据表中资料,各年龄组相比较,试判断以下说法的对错,并说明理由
(1)“40 –”组的人最容易死于肿瘤,“60 –”组次之;
(2)因肿瘤而死亡者中“40 –”组的最多。
(共4分)
2. 一项治疗糖尿病的临床试验中,将268名患者随机分为两组,一组204人服用盐酸苯乙双胍,死于心血管的有26人。另一组64人服安慰剂,死于心血管的有2人。资料整理如下,
表7 两种疗法的心血管病病死率比较
疗法
观察例数
死亡
生存
病死率(%)
盐酸苯乙双胍
204
26
178
12.75
安慰剂
64
2
62
3.13
合计
268
28
240
10.45
请问:(1)该资料是何种类型的资料?
(2)可以用哪种方法来检验两种疗法心血管病病死率的差异,请写出检验方法名称及相应计算公式,并说明选择的理由,写出可能的结果(不需计算)。(共4分)
3. 为了解某一新降血压药物的效果,将20名高血压病患者随机分为实验组和对照组,实验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。
表8 两组药物治疗前后的舒张压(mmHg)
新药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
102
100
92
98
118
100
102
116
109
116
治疗后
90
90
85
90
114
95
86
84
98
103
标准药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
98
103
110
110
110
94
104
92
108
110
治疗后
100
94
100
105
110
96
94
100
104
109
请问:(1)这是何种类型资料?
(2)这是何种实验设计方案?
(3)欲推断新药是否有效,最好采用什么假设检验方法?
(4)要比较新药与标准药的疗效是否相同,最好采用什么假设检验方法?(共6分)
4. 下表为抽样调查资料,根据你所学过的知识回答:
表9 某地7岁健康儿童身高(cm)结果
身高组段
人 数
男
女
108~
1
1
110~
3
2
112~
9
5
114~
9
12
116~
15
13
118~
18
28
120~
21
29
122~
14
24
124~
10
15
126~
4
9
128~
3
7
130~
2
5
132~134
1
2
合 计
110
152
(1) 可以选用哪些指标对该资料进行描述分析?
(2) 如何进行统计推断?
(要求说出你选用的统计指标及检验方法名称和作出该选择的理由,不必计算)
(共8分)
5、为什么说期望寿命ex可以反映一个地区或国家的人群健康水平?(共3分)
6、据文献记载,1747年5月20日,英国的Lind J 医生将12名病情相似(牙龈溃烂、皮肤有出血点、双膝无力)的病人带到一艘船上,将他们分为6组,分别给予干预
A:饮苹果汁; B:服硫酸丹剂;
C:服醋; D:饮海水,服缓和的泻药(病情最重者);
E:食橘子、柠檬;F:服大蒜、芥子等成分组成的干药。
请回答:
(1) 用现代统计学的观点,哪些方面符合统计学要求?
(2) 如果今天重复Lind J 医生的干预试验,在统计设计与分析中还应注意哪些问题?
(共5分)
7、Graff-Lonnevig等欲比较F(formoterol)与S(salbutamol)治疗儿童哮喘病的效果,将14个病人随机分为2组,一组病人在第一时期服用F,第二时期服用S,另一组病人在第一时期服用S,第二时期服用F,服药后8小时测量PEF值,数据如下:
表10 两种药物治疗哮喘病儿童PEF值(升/分钟)
受试验者编号
时期Ⅰ
时期Ⅱ
药物
PEF值
药物
PEF值
1
F
310
S
270
3
F
310
S
260
6
F
370
S
300
8
F
410
S
390
9
F
250
S
210
11
F
380
S
350
14
F
330
S
365
2
S
370
F
385
4
S
310
F
400
5
S
380
F
410
7
S
290
F
320
10
S
260
F
340
12
S
90
F
220
13
S
300
F
330
请问:
(1)这是何种类型的资料?
(2)该项研究采用了何种设计方案?
(共5分)
8、某研究者欲探讨不同剂量的补肾益寿胶囊及CY两种药物对小鼠迟发超敏反应的影响,以耳肿重量为实验效应指标,补肾益寿胶囊共4个剂量组(0,5,10,20),CY两个剂量组(0,0.025),该研究者采用了student-t检验,结果见下表。
表11 不同药物对小鼠迟发超敏反应的影响
药物
剂量(g/Kg)
鼠数
耳肿重量(mg)
P
与0g/Kg补肾益寿胶囊组比较
与0.025g/Kg CY组比较
补肾益寿胶囊
0
10
21.22.7
补肾益寿胶囊
5
10
22.33.5
>0.05
补肾益寿胶囊
10
10
18.83.1
>0.05
补肾益寿胶囊
20
10
16.52.4
<0.01
CY+补肾益寿胶囊
0.025+0
10
11.21.5
CY+补肾益寿胶囊
0.025+5
10
14.32.9
<0.01
CY+补肾益寿胶囊
0.025+10
10
18.63.6
<0.01
CY+补肾益寿胶囊
0.025+20
10
19.23.4
<0.01
请问:该实验采用了何种设计方案? 研究者采用的假设检验方法是否正确?为什么?
(共5分)
重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(一)
参考答案
一、 名词解释(每小题4分,共20分)
1.Population and sample
总体(population)与样本(sample)
总体:根据研究目的所确定的同性质的全部观察单位某一指标(或某些因素及结果)测量值的集合。根据总体集合所包括元素是否有限,可分为有限总体与无限总体;总体具有特定的分布特征及参数;
样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数
2.Standard deviation and standard error
标准差与标准误
比较内容
标准差
标准误
意义
表示单个观测值对其均数的离散程度
表示样本统计量对总体参数的离散程度
计算方法
变量值的标准差为
样本均数的标准误为
阳性结果的标准差为
样本阳性率的标准误为
数值大小
大
小
用途
描述:观测值的变异范围
推断:估计总体参数的可信区间
假设检验
3.TypeⅠerror and typeⅡerror
假设检验中,无论是接受还是拒绝原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为;如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为;当样本含量确定时,越大,则越小,反之,越小,则越大,如拟同时降低与,则需增大样本含量。
4.Normal distribution and binomial distribution
正态分布(Normal distribution)是一种连续型随机变量常见而重要的分布,如果连续型随机变量X在实数范围内取值,且具有如下的概率密度函数
(-∞<X<+∞)
和概率分布函数 (-∞<X<+∞),
称连续型随机变量X服从正态分布,记为X~N(μ,σ2)。
二项分布(binomial distribution):一种离散型随机变量的分布,表示在n次Bernoulli试验中,结果A出现K次这一随机事件的分布,记为X~B(n,π)。其概率计算式为:
P(X=k)= 。
5.±1.96S与±1.96
±1.96S:从正态总体中抽样,样本含量较大时,观测值95%的波动范围;
±1.96:从正态总体中抽样,样本含量较大时,总体均数95%的可信区间(置信区间)
二、是非题 (每小题0.5分,共6分),判断下列各题的正误,正确的在题后括号内打“√”,错误的打“×”
1 × 2 √ 3 × 4 √ 5 √ 6 √ 7 × 8 ×
9 √ 10 × 11 √ 12 ×
三、填空题 (每空0.5分,共17 分)
1 设计 收集资料 整理资料 分析资料
2 集中趋势 离散趋势
3 正态分布法 百分位数法 正态分布 偏态分布
4 近似t 检验 数据变换使达到正态性及方差齐性要求 非参数假设检验
5 点估计 区间估计 区间估计
6 P大于0.05 接受 无统计学意义
7 r (相关系数)
8 随机原则 对照原则 重复原则
9 所设立的对照组必须与实验组达到均衡一致,均衡是指各对比组之间除处理因素不同外,其他重要的,可控制的非处理因素的分布尽量保持一致
10 全面普查 抽样调查 典型调查
11 单纯随机抽样 系统随机抽样 整群抽样 分层抽样
12 单纯随机抽样
13 静态 动态
四、单项选择题 (从每小题的五个备选答案中,选出一个正确的答案,并将其字母填在题干横线上,每小题1分,共28分)
1 C 2 B 3 E 4 E 5 E 6 C 7 C 8 E 9 E
10 E 11 B 12 A 13 C 14 A 15 D 16 C 17 D 18 B
19 D 20 C 21 B 22 E 23 B 24 D 25 E 26 D
27 D 28 E
五、应用题(1-5小题每小题5分,第6小题4分,共29分)
1 (1) 该资料是计量资料 采用的是完全随机设计
(2) 如果该资料服从正态分布且两总体方差相等,则直接采用t 检验
如果该资料服从正态分布但两总体方差不等,则采用近似t检验或变量变换使其满足方差分析条件情况下,对转换值进行t检验,或进行秩和检验。
2 (1)不正确
(2)第一,方差不齐,不能直接采用参数假设检验方法;第二,多组均数的比较,不能采用student-t 检验,否则会增大I类错误的概率。本资料可采用完全随机设计多组比较的秩和检验。
3 统计分析包括统计描述与统计推断。
由该频数表可知,两组数据是呈对称分布的计量资料,需从集中趋势和离散趋势进行描述,可选用算术均数及标准差。
统计推断分为参数估计和假设检验,首先可用点估计,估计男童和女童身高的总体均数,但此时未考虑抽样误差,因此,选用区间估计较好,可计算总体均数95%的置信区间。
比较男童及女童身高的总体均数是否不同,可用两样本资料的U检验(因两样本呈对称分布,近似正态分布,且均为大样本)。
4 不能得出以上结论
首先实验设计有错误,酒石酸锑钾一组的实验对象与枸橼酸乙胺嗪一组的实验对象
不同,前者选用的实验对象是不合并其它寄生虫的丝虫病患者,而后者却是选用的是
合并血虫病的丝虫病患者,两组间不具有可比性。
其次,根据所得到的治愈率不能下结论说哪一种治疗药物的效果好,应该做出相应
的假设检验,根据假设检验才能做出结论。
5 (1)调查研究
(2) 患病率
(3) 采用趋势性卡方检验,检验男童与女童以及合计组贫血状况是否随着时间的推移得到了改善.;
采用两独立样本资料的卡方检验可计算各年度男童的贫血状况与女童的贫血状况是否不同。
6 平均期望寿命是通过各年龄组段的死亡率经过一系列计算得到的,它将不稳定的死亡率转化成了相对稳定的死亡概率,同时平均期望寿命消除了内部构成不同的影响,能够较准确地反映一个地区或国家的人群健康水平。
重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(三)
考试方式(闭卷): 考试时间:150 分钟
一、名词解释(每小题4分,共20分)
6. 样本与总体
7. 标准差与标准误
8. I类错误与II类错误
9. 精密度与准确度
10. 直线相关分析与直线回归分析
二、单项选择题 (从每小题的五个备选答案中,选出一个正确的答案,并将其字母填在题干横线上,每小题2分,共30分)
1. 在正态分布曲线下,计算的概率为___________
A. 0.500 B. 0.475 C. 0.450 D. 0.050 E. 0.010
2.某医师观察环丙沙星治疗下呼吸道感染者131例的临床疗效,结果见下表:
表1 环丙沙星治疗下呼吸道感染的临床疗效
病种
总例数
痊愈
显效
好转
无效
无效率%
肺炎
慢支炎感染
63
68
30
21
21
24
11
15
1
8
1.59
11.76
A. t检验 B.秩和检验 C. 方差分析 D. χ2检验 E.q检验
3.参数统计假设检验的目的是____。
A.判断样本对总体是否具有代表性 B.推断各总体水平参数是否相等
C.判断表达样本平均水平的统计量有无显著性差别
D.对测定方法的精密度、准确度、灵敏度提出质控要求
E.对总体水平进行区间估计
4. 四格表中,如果有一个实际数为0 ,________________。
A . 根本不能检验 B. 就不能作检验 C. 仍然能够作检验
D. 就必须用校正检验 E . 还不能决定是否可以作检验
5. 统计假设检验中常使用P值作为推断的依据,P值的含义是____。
A.表达对比组数据来自同一总体的概率 B.表达对比组抽样误差的大小
C.表达对比组统计量不相同的概率
D.拒绝参数相等假设实际犯Ⅰ类错误的概率
E. 接受参数相等假设实际犯Ⅱ类错误的概率
6.完全随机设计方差分析中,引起数据变异的原因可能区分为___________
A.个体因素与随机(误差)因素 B.处理因素与区组因素 C.样本含量与把握度
D.处理因素与随机(误差)因素 E.个体因素与处理因素
7.方差分析的应用条件之一是方差齐性,所谓方差齐性是指__________
A.各比较组的样本方差相等 B.各比较组相应的总体方差相等
C.组内方差=组间方差 D.总方差=各组方差之和 E.各组自由度相等
8. 某医师测定了230名正常人和165名慢性肝炎病人的白蛋白相对比资料,欲比较正常人和病人该指标的水平是否一致,此时应采用以下____统计检验公式进行分析。
A. B. C.
D. E.
9. 根据下列四格表资料,指出该研究方法的诊断正确率是____。
表2 某方法学实验结果
阳性数
阴性数
合计
病 人
67
8
75
正常人
7
68
75
合计
74
76
150
A.89.3% B.90.7% C.10.0% D.49.3% E.90.0%
10.欲比较丙氨酸氨基转移酶两种水平对HBeAg阴转的影响(资料见下表),应进行_____。
表3 丙氨酶氨基转移酶水平,对疗效的影响
组别
. HBeAg
+ -
≤3ULN
>3ULN
16
4
4
8
A. B. P(x)= C.
D. P= E. u=
11. 完全随机设计三组人群某抗体滴度资料的统计比较,应选用____。
A. B. C.
D. E.
12. 某医师研究婴儿出生体重和双顶径的关系,收集了婴儿出生体重和双顶径的数据如下表:
表4 婴儿出生体重和双顶径的关系
体重(g)
273 299 226 315 294 260 383 273 234 329 302 357
双顶径(mm)
94 88 91 99 93 87 94 93 81 94 94 91
若要分析二者的数量依存关系,宜选用的方法是 。
A. B. C.
D. E.
13. 用图示法表达一组SARS病人年龄分布,宜绘制 。
B、 直条图 B、直方图 C、普通线图 D、饼图 E、散点图
14、在定性的检测方法学研究中,方法的准确度用____计算。
A.
B. C.
D. E.
15. 对同一标准品,用某方法进行了8次平行测定,欲分析该方法的批内精密度应计算____。
A. B. C.
D. E. =
三、填空题 (每空1分,共20 分)
1. 对于一份统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括 和 两方面的内容。
2. 已知某医学统计资料服从正态分布,且其n=400,=30,s=5。据此可估计其中95%的数据波动范围是___________________,其总体均数95%的可信区间为____________________________。
3.单因素完全随机多组测定数值变量资料的统计比较,应采用___________________检验,当具有统计学意义时,再根据需要进行两两比较。这种情况,不能直接进行两两t检验,其原因是__________________________ ______________________________________。
4. 随机误差的含义是____________________________________________,系统误差的含义是_______________________________________________。前者常用_______________统计指标来表达,后者常用_______________统计指标来表达。
5.对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有:率与________________、________________三类。
6.实验室质量控制的步骤为__________________、__________________、__________________、__________________、__________________、__________________、__________________与__________________。
四. 应用题(第1小题4分,第2小题7分,第3小题5分,第4小题8分,第5小题6分,共30分)
1. 某医师为研究肿瘤死亡与年龄的关系,收集了以下数据:
表5 某地、某年肿瘤死亡资料
年龄(岁)
人口数
死亡总数
肿瘤死亡数
肿瘤死亡/总死亡(%)
0 -
82920
138
4
2.9
20 -
46639
63
12
19.0
40 -
28161
172
42
24.4
60 -
9370
342
32
9.4
合计
167090
715
90
12.6
根据表中资料,各年龄组相比较,试判断以下说法的对错,并说明理由
(1)“40 –”组的人最容易死于肿瘤,“60 –”组次之;
(2)因肿瘤而死亡者中“40 –”组的最多。
2. 为了解某一新降血压药物的效果,将20名高血压病患者随机分为实验组和对照组,实验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。
表6 两组药物治疗前后的舒张压(mmHg)
新药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
102
100
92
98
118
100
102
116
109
116
治疗后
90
90
85
90
114
95
86
84
98
103
标准药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
98
103
110
110
110
94
104
92
108
110
治疗后
100
94
100
105
110
96
94
100
104
109
请问:(1)这是何种类型资料?
(2) 这是何种实验设计方案?
(3)要比较新药与标准药的疗效是否相同,最好采用什么假设检验方法?
仅要求写出主要统计检验公式,不计算结果。
3.某医师比较两种药物治疗脑血管病的疗效,将78例病人分为两组,得下表资料:
表7 两种药物治疗脑血管病疗效
有效
无效
合计
有效率(%)
A药
46
6
52
88.46
B药
19
7
26
73.08
合计
65
13
78
83.33
请回答:
(1) 这是什么类型的资料?
(2) 这是何种实验设计方案?
(3)欲推断两种药物总体有效率是否一致,应采用何种统计方法?
(写出主要统计检验公式、结果判断,不计算结果)
4. 下表为抽样调查资料,根据你所学过的知识回答:
表8 某地7岁健康儿童身高(cm)结果
身高组段
人 数
男
女
108~
1
1
110~
3
2
112~
9
5
114~
9
12
116~
15
13
118~
18
28
120~
21
29
122~
14
24
124~
10
15
126~
4
9
128~
3
7
130~
2
5
132~134
1
2
合 计
110
152
(3) 可以选用哪些指标对该资料进行描述分析?
(4) 可以选用哪些检验方法来检验男女身高的差异?
(要求说出你选用的统计指标及检验方法名称和作出该选择的理由,不必计算)
5、某检验师设计了一种简便微量碘测定方法,并对其准确度进行了研究,得出下列实验数据,欲了解该方法的恒定系统误差和比例系统误差,应如何进行分析?
表9 简捷法检测水样中微量碘及加标试验(μg/L)
水样编号
样品含碘量
加标量
测得总量
“回收率”(%)
1
8.4
2.0
10.5
105.0
2
4.2
3.0
7.3
103.0
3
5.8
4.0
9.6
95.0
4
8.8
5.0
13.7
98.0
5
9.8
6.0
15.8
100.0
6
7.2
7.0
14.4
102.9
重庆医科大学200 —200 学年度 学期《医学统计学》(三)
考试试卷参考答案
一、名词解释(每小题4分,共20分)
1、总体与样本
总体(population)与样本(sample)
总体:根据研究目的所确定的同性质的全部观察单位某一指标(或某些因素及结果)测量值的集合。根据总体集合所包括元素是否有限,可分为有限总体与无限总体;总体具有特定的分布特征及参数;
样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数 。
2、标准差与标准误
比较内容
标准差
标准误
意义
表示单个观测值对其均数的离散程度
表示样本统计量对总体参数的离散程度
计算方法
变量值的标准差为
样本均数的标准误为
阳性结果的标准差为
样本阳性率的标准误为
数值大小
大
小
用途
描述:观测值的变异范围
推断:估计总体参数的可信区间
假设检验
3、I类错误与II类错误
假设检验中,无论是接受还是拒绝原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为;如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为;当样本含量确定时,越大,则越小,反之,越小,则越大,如拟同时降低与,则需增大样本含量。
4、精密度与准确度
精密度(precision):指对同一标本进行多次重复测定时,测定值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。此值愈小,说明测定方法重现性愈好。
准确度(accuracy):测定值与真值的接近程度,用于说明测定方法有无系统误差。一般采用回收试验,计算回收率度量其大小。回收率愈接近100%,则准确度愈高;当回收率偏离100%较大时,则测定方法存在系统误差。
准确度与精密度均为评价检测方法(包括仪器、试剂、操作等)可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使其精密度高,也不能采用此方法;当测定方法的精密度差,其准确度也不会高。
5、直线相关与直线回归
1)区别
资料要求:
回归要求因变量Y在给定x=x0的条件下,服从正态分布; X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。相关要求两个变量X、Y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。可以计算两个回归方程;
应用:
相关分析主要是描述两个变量之间线性关系的密切程度和方向;回归分析说明两变量间依存变化的数量关系,不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
统计量:
回归分析中主要统计量为截距a和回归系数b,相关分析统计量为相关系数r。回归系数有单位,相关系数无单位。
2)联系
r与b符号一致
对一组数据若同时计算r与b,它们的正负号是一致的。
假设检验等价
对同一样本,r和b的假设检验得到的t值相等。
3).用
展开阅读全文