1、医学统计学练习题及答案第一章 医学统计中的基本概念2第二章 集中趋势的统计描述4第三章 离散程度的统计描述7第四章 抽样误差与假设检验12第五章 t检验14第六章 方差分析20第七章 相对数及其应用26第八章 检验30第九章 非参数检验35第十章 线性相关与回归45第十一章 多元线性回归与多元逐步回归51第十二章 统计表与统计图56第十三章 医学实验设计与诊断试验的评价60练 习 题 答 案第一章 医学统计中的基本概念练 习 题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件 B. 各种类型的数据C. 动物和人的本质 D. 疾病的预防与治疗E有变异的医学事件 2. 用样本推论
2、总体,具有代表性的样本指的是A总体中最容易获得的部分个体 B在总体中随意抽取任意个体C挑选总体中的有代表性的部分个体 D用配对方法抽取的部分个体E依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是A收缩压测量值 B脉搏数C住院天数 D病情程度E四种血型4. 随机误差指的是A. 测量不准引起的误差 B. 由操作失误引起的误差C. 选择样本不当引起的误差 D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差 B. 系统误差C. 过失误差 D. 记录误差E仪器故障误差答案: E E D E A二、简答题1. 常见的三类误差是什么?应采取
3、什么措施和方法加以控制?参考答案常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操
4、作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2. 抽样中要求每一个样本应该具有哪三性?参考答案从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本
5、得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3. 什么是两个样本之间的可比性?参考答案可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣)第二章 集中趋势的统计描述练习题一、单项选择题1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. 中位数 B. 几何均数 C. 均数 D. 百分位数E. 频数
6、分布2. 算术均数与中位数相比,其特点是 A不易受极端值的影响 B能充分利用数据的信息 C抽样误差较大 D更适用于偏态分布资料 E更适用于分布不明确资料3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀4. 将一组计量资料整理成频数表的主要目的是A化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验E. 提供数据和描述数据的分布特征5. 6人接种流感疫苗一个月后测定抗体滴度为 1:20、1:40、1:80、1:80、1:160、1:320,求平均滴
7、度应选用的指标是A. 均数 B. 几何均数 C. 中位数 D. 百分位数E. 倒数的均数答案: A B D E B二、计算与分析1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。参考答案 2. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下: 202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 1
8、99 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 2
9、52 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数、和。参考答案(1)编制频数表:某地100例30-40岁健康男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110 2 2 2125 4 6 6140111717155163333170276060185127272200138585215 79292230 59797245 3 100 100合计 100画直方图: 图 某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:从上述直方图能够看出:此计
10、量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数: 3 测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度滴度倒数正常人数肝癌病人数 8 7 1 1652 3213 6432 12801 25601参考答案肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果 滴度倒数(X)正常人数()肝癌病人数()lgxlgxlgx 8710.906.300.9016521.206.002.4032131.501.504.5064321.815.433.62128012.110.00
11、2.11256012.410.002.41合计 16 10- 19.23 15.94 正常人乙肝表面抗原(HBsAg)滴度为1: 15.92肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26(李 康)第三章 离散程度的统计描述练 习 题一、单项选择题1. 变异系数主要用于A比较不同计量指标的变异程度 B. 衡量正态分布的变异程度C. 衡量测量的准确度 D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小2. 对于近似正态分布的资料,描述其变异程度应选用的指标是A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差3. 某项指标95%医学参考值范围表示的是A.
12、检测指标在此范围,判断“异常”正确的概率大于或等于95% B. 检测指标在此范围,判断“正常”正确的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”4应用百分位数法估计参考值范围的条件是A数据服从正态分布 B数据服从偏态分布 C有大样本数据 D数据服从对称分布 E数据变异不能太大5已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A全距 B标准差 C变异系数 D方差 E四分位数间距答案:A E D B E二、计算与分析1. 下表
13、为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。 表 手术前后患者血催乳素浓度(ng/ml) 例号血催乳素浓度术前术后12764128801103 16002804324615398105 6266437500258 176030095002151022092参考答案血催乳素浓度术前均值672.4 ng/ml,术后均值127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。术前:,术后:, 可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2. 某地144例304
14、5岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。试估计该地3045岁成年男子血清总胆固醇的95%参考值范围;血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?参考答案正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。下限:(mol/L)上限:(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L6.62 mmol/L。该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmo
15、l/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布值:问题转化为求值大于0.91的概率。由于标准正态分布具有对称性,所以值大于0.91的概率与值小于0.91的概率相同。查附表1得,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。3. 某地200例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。 表 某地200例正常成人血铅含量(mol/L)的频数分布血铅含量频 数累积频数0.007 70.2449560.
16、4845101 0.7232133 0.96281611.20131741.44141881.6841921.9241962.1611972.4021992.64 1 200参考答案(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。 某地200例正常成人血铅含量(mol/L)的频数分布 血铅含量组中值频 数累积频数累积频率0.000.12773.50.240.36495628.00.480.604510150.50.720.843213366.50.961.082816180.
17、51.201.321317487.01.441.561418894.01.681.80419296.01.922.04419698.02.162.28119798.52.402.52219999.52.642.761200100(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。百分位数法:第95%百分位数位于1.68组段,组距为0.24,频数为4,该组段以前的累积频数为188,故即该地正常成人血铅值的95%参考值范围为小于1.80。正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。某地200例正常成人血铅含量()均值和标准差计算表血铅含量组中值()频 数
18、()0.00 0.12-0.927-6.445.92480.240.36-0.4449-21.569.48640.480.60-0.2245-9.92.1780.720.84-0.0832-2.560.20480.961.080.0328 0.840.02521.201.320.1213 1.560.18721.441.560.1914 2.660.50541.681.800.264 1.040.27041.922.040.314 1.240.38442.162.280.361 0.360.12962.402.520.402 0.800.32002.642.760.44 1 0.440.193
19、6合计 200-31.5219.8098计算均值和标准差: 单侧95%参考值范围:即该地正常成人血铅值的95%参考值范围为小于1.96,与百分位数法相比两者相差不大。 (李 康)第四章 抽样误差与假设检验练习题一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数
20、的分布近似为A. 正偏态分布 B. 负偏态分布C. 正态分布 D. t分布E. 标准正态分布4. 假设检验的目的是A. 检验参数估计的准确度 B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2109/L9.1109/L,其含义是A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计
21、算与分析1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。参考答案样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。,95%可信区间为 下限:(g/L)上限:(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L101.54g/L。2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问
22、题:如何衡量这100名儿童总胆固醇样本平均数的抽样误差?估计100名儿童的胆固醇平均水平的95%可信区间;根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。参考答案 均数的标准误可以用来衡量样本均数的抽样误差大小,即mg/dl, 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。,则95%可信区间为 下限:(mg/dl)上限:(mg/dl)故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl213.38mg/dl。因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且
23、胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。 (李 康)第五章 t检验练 习 题一、单项选择题1. 两样本均数比较,检验结果说明A. 两总体均数的差别较小 B. 两总体均数的差别较大 C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 E. 可以确认两总体无差别2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指A. 两样本均数的差别具有实际意义 B. 两总体均数的差别具有实际意义 C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别 E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P值越
24、小说明A. 两样本均数差别越大 B. 两总体均数差别越大 C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 E. 越有理由认为两样本均数相同4. 减少假设检验的类误差,应该使用的方法是A. 减少类错误 B. 减少测量的系统误差 C. 减少测量的随机误差 D. 提高检验界值 E. 增加样本含量5两样本均数比较的t检验和u检验的主要差别是A. t检验只能用于小样本资料 B. u检验要求大样本资料C. t检验要求数据方差相同 D. t检验的检验效能更高E. u检验能用于两大样本均数比较答案:D E D E B二、计算与分析 1. 已知正常成年男子血红蛋白均值为140g/L,今随机调
25、查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。问该厂成年男子血红蛋白均值与一般成年男子是否不同?参考答案因样本含量n50(n60),故采用样本均数与总体均数比较的u检验。(1)建立检验假设, 确定检验水平,该厂成年男子血红蛋白均值与一般成年男子相同,该厂成年男子血红蛋白均值与一般成年男子不同a=0.05(2) 计算检验统计量=7.75(3) 确定P值,做出推断结论7.751.96,故P,P 1.19,F0.05,按0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与度肺气肿病人1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t检验。(1)建立检验假设,
26、 确定检验水平,健康人与度肺气肿病人抗胰蛋白酶含量相同,健康人与度肺气肿病人抗胰蛋白酶含量不同a=0.05(2) 计算检验统计量=1.12=5.63(3) 确定P值,做出推断结论t5.63 ,P 0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与度肺气肿病人1抗胰蛋白酶含量不同。4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?表 某地241名正常男性上颌间隙(cm)身高 (cm)例数均数标准差1611160.21890.23511721250.22800.2561参考答案本题属于大样本均数比较,采用两独立样本均数比较的u
27、检验。由上表可知,=116 , =0.2189 , =0.2351=125 , =0.2280 , =0.2561(1)建立检验假设, 确定检验水平,不同身高正常男性其上颌间隙均值相同,不同身高正常男性其上颌间隙均值不同a=0.05(2) 计算检验统计量=0.91(3) 确定P值,做出推断结论u0.910.05,按=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?表 钩端螺旋体病患者凝溶试验的稀释倍数标准株10020040040040040080016
28、0016001600320032003200水生株1001001002002002002004004008001600参考答案本题采用两独立样本几何均数比较的t检验。t2.689t0.05/2,22,P,故P0.05,差别有统计学意义,按a0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t检验。=1.53, t0.05/22.009,t0.05,按=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。 (沈其君, 施榕)第六章 方差分析 练 习 题
29、一、单项选择题1. 方差分析的基本思想和要点是A组间均方大于组内均方 B组内均方大于组间均方C不同来源的方差必须相等 D两方差之比服从F分布E总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指 A. 各比较组相应的样本方差相等 B. 各比较组相应的总体方差相等 C. 组内方差=组间方差 D. 总方差=各组方差之和 E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是A. 随机测量误差大小 B. 某因素效应大小C. 处理因素效应与随机误差综合结果 D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t检验的关
30、系是A. t检验结果更准确 B. 方差分析结果更准确C. t检验对数据的要求更为严格 D. 近似等价E. 完全等价5多组均数比较的方差分析,如果,则应该进一步做的是A两均数的t检验 B区组方差分析 C方差齐性检验 D检验E确定单独效应答案:E B C E D二、计算与分析1在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别? 各剂量组48小时部分凝血活酶时间(s)0.5 U1 U2 U3 U36.840.032.9
31、33.034.435.537.930.734.336.730.535.335.739.331.132.333.240.134.737.431.136.837.639.134.333.440.233.529.838.338.136.635.438.432.432.031.239.835.633.8参考答案如方差齐同,则采用完全随机设计的方差分析。经Bartlett 方差齐性检验,=1.8991 ,=3。由于=7.81, ,故0.05,可认为四组48小时部分凝血活酶时间的总体方差齐同,于是采用完全随机设计的方差分析对四个剂量组部分凝血活酶时间进行比较。(1)提出检验假设,确定检验水准:,即四个剂量
32、组部分凝血活酶时间的总体均数相同:、不全相同,即四个剂量组部分凝血活酶时间的总体均数不全相同=0.05(2)计算检验统计量,列于方差分析表中方差分析表变异来源平方和自由度均方值处理组间101.0860333.69534.80组内(误差)252.4780 36 7.0133总变异353.5640 39(3)确定值,做出推断结论 分子自由度,分母自由度,查界表(方差分析用),=2.87。由于=4.80,故0.05,按照= 0.05的显著性水准,拒绝,接受,差别有统计学意义,可认为四个剂量组部分凝血活酶时间的总体均数不全相同,进而需进行均数间多重比较。 本题采用SNK法进行多重比较。(1)提出检验假
33、设,确定检验水准:,即任意两组部分凝血活酶时间的总体均数相同:,即任意两组部分凝血活酶时间的总体均数不相同=0.05(2)计算检验统计量,用标记字母法标记 多重比较结果(=0.05)组别均数例数SNK标记1 U37.83010A2 U35.10010B3 U34.37010B0.5 U33.62010B(3)做出推断结论1U与 0.5U,1U与 2U ,1U与3U间差别有统计学意义(标记字母不同),可认为1U与 0.5U,1U与 2U ,1U与3U间部分凝血活酶时间的总体均数不同。0.5 U、2U、3U组彼此间差别无统计学意义(均含有字母B),可认为这三组部分凝血活酶时间的总体均数相同。2为探讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用,将36只二级SD大鼠按性别、体重配成12个配伍组,每一配伍组的3只大鼠被随机分配到对照组、损伤组与激素组,实验24小时后测量支气管肺泡灌洗液总蛋白水平(g/L),结果如下表。问3组大鼠的总蛋白水平是否相同?3组大鼠总蛋白水平(g/L)配伍组对照组损伤组激素组10.361.480.3020.281.42