医学统计学部分试题及答案.doc

资源描述

成都医学院医学统计学网络课程中心部分试题及答案检验—七十五第一章绪论 30 1.下列关于概率的说法，错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率很小，在单次研究或观察中时，称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中，属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历 3.下列有关个人基本信息的指标，其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法，不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言，参数难以测定，仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中，总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者 [参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。答：当某事件发生的概率很小，习惯上认为小于或等于0.05时，统计学上称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓小概率事件原理，它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答：某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念答：研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的观察单位的集合，通常有无限总体和有限总体之分，前者指总体中的个体数是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体数是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中，该地2007年全部正常成年男子的红细胞数就构成一个总体，从此总体中随机抽取2000人，分别测得其红细胞数，组成样本，其样本含量为2000。第二章调查研究设计 1. 以下五个问题中，最符合调查问卷设计要求的是 A.你一个月工资多少？ B.你一个月吃多少克盐？ C.你是否有婚外恋：①有 ②无 D.你和你的妈妈认为女孩几岁结婚比较好? E.如果只生一个孩子，你希望孩子的性别是：①女 ②男 ③男女均可 [参考答案]E.如果只生一个孩子，你希望孩子的性别是：①女 ②男 ③男女均可 2.普查是一种全面调查的方法，与抽样调查相比，叙述正确的是 A.确定对象较为简单 B.适于发病率较低疾病的调查 C.不易获得反映平均水平的统计指标 D.因涉及面广，可产生较大的抽样误差 E.更易统一调查技术，提高调查质量 [参考答案]A.确定对象较为简单 3. 欲了解某地区狂犬病死亡人数上升的原因，较适宜的抽样方式为 A.单纯随机抽样 B.整群抽样 C.分层抽样 D,典型调查 E.普查 [参考答案]D.典型调查 4. 某县有30万人口，其中农村人口占80%，现欲对农村妇女的计划生育措施情况进行调查，调查对象应为 A. 该县所有的已婚夫妻 B.该县所有的农村妇女 C.该县所有的育龄期妇女 D.该县所有的已婚妇女 E.该县所有已婚育龄期农村妇女 [参考答案]E.该县所有已婚育龄期农村妇女 5. 为了解乌鲁木齐市儿童的肥胖状况，分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查，这种抽样方法属于 A. 单纯随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 E.多阶段抽样 [参考答案]B.系统抽样 6. 下列关于调查设计的叙述，正确的是 A. 明确调查目的是调查研究最核心的问题 B.采用抽样调查还是普查是由该地区的经济水平决定的 C.调查设计出现缺陷时，可以通过相应的统计分析方法弥补 D.一旦制定了调查研究计划，在实际操作过程中，就不可改变 E.调查的质量控制主要在调查问卷设计阶段 [参考答案]A.明确调查目的是调查研究最核心的问题 7. 条件相同时，下列抽样方法中抽样误差最大的是 A. 单纯随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 E.无法直接比较 [参考答案]E.整群抽样 8. 以下抽样方法中不属于概率抽样的是 A. 单纯随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 E.雪球抽样 [参考答案]E.雪球抽样 9. 实验性研究与观察性研究的根本区别在于 A. 抽样方法不同 B.研究对象不同 C.是否设立对照组 D.假设检验方法不同 E.是否人为施加干预措施 [参考答案]E.是否人为施加干预措施 10. 简述调查问题的顺序安排。答：调查问题顺序安排总原则：①符合逻辑；②一般问题在前，特殊问题在后；③易答题在前，难答题在后；④如果采用封闭式和开放式相结合的问题，一般先设置封闭式问题；⑤敏感问题一般放在最后。此外，在考虑问题顺序时，还应注意问题是否适合全部调查对象，并采用跳答的形式安排问题和给出指导语。 11. 常用的非概率抽样方法有哪些？答：常用的非概率抽样方法有偶遇抽样、立意抽样、定额抽样、雪球抽样等。 12. 试比较常用的四种概率抽样方法的优缺点。答：单纯随机抽样的优点是均数(或率)及标准误的计算简便。缺点是当总体观察单位数较多时，要对观察单位一一编号，比较麻烦，实际工作中有时难以办到。系统抽样的优点是：①易于理解，简便易行；②容易得到一个按比例分配的样本，由于样本相应的顺序号在总体中是均匀散布的，其抽样误差小于单纯随机抽样。系统抽样的缺点是：①当总体的观察单位按顺序有周期趋势或单调增(或减)趋势，系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形，一旦确定了抽样间隔，就必须严格遵守，不得随意更改，否则可能造成另外的系统误差。②实际工作中一般按单纯随机抽样方法估计抽样误差，因此这样计算得到的抽样误差一般偏大。分层抽样的优点是：①减少抽样误差：分层后增加了层内的同质性，因而观察值的变异度减小，各层的抽样误差减小，在样本含量相等的情况下其标准误一般均小于单纯随机抽样、系统抽样和整群抽样的标准误；②便于对不同的层采用不同的抽样方法，有利于调查组织工作的实施；③还可对不同层进行独立分析。其缺点是当需要确定的分层数较多时，操作比较麻烦，实际工作中实施难度较大。整群抽样的优点是便于组织，节省经费，容易控制调查质量。缺点是当样本含量一定时，其抽样误差一般大于单纯随机抽样的误差。 13. 简述调查设计的基本内容。答：调查设计的基本内容包括：①明确调查目的和指标；②确定调查对象和观察单位；③确定调查方法；④确定调查方式；⑤确定调查项目和调查表；⑥制定资料整理分析计划；⑦制定调查的组织计划。 14. 调查研究的主要特点是什么？答：调查研究的主要特点是：①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的，不能人为给予干预措施。②不能用随机化分组来平衡混杂因素对调查结果的影响。第三章实验研究设计 1. 药品上市后应用阶段进行的临床试验属于 A. I期临床试验 B. II期临床试验 C. III期临床试验 D. IV期临床试验 E.现场试验 [参考答案] D. IV期临床试验 2. 临床试验的统计分析主要包括 A.可比性分析、疗效评价、安全性评价 B.可比性分析、优效性分析、劣效性分析 C.可比性分析、安全性评价、可行性分析 D.优效性分析、等效性分析、安全性评价 E.疗效评价、安全性评价、可行性分析 [参考答案] A.可比性分析、疗效评价、安全性评价 3. 在某临床试验中，将180例患者随机分为两组，试验组给予试验药＋对照药的模拟剂，对照给予对照药＋试验药的模拟剂，整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用控制偏倚的方法有 A.单盲、多中心 B.随机化、多中心 C.随机化、单盲 D.随机化、双盲双模拟 E.双盲双模拟、多中心 [参考答案] D.随机化、双盲双模拟 4. 将两个或多个处理因素的各水平进行组合，对所有可能的组合都进行实验，该实验设计方案是 A.随机区组设计 B.完全随机设计 C.析因设计 D.配对设计 E.交叉设计 [参考答案] C.析因设计 5. 比较两种疗法对乳腺癌的疗效，若两组患者的乳腺癌分期构成不同可造成 A.选择性偏倚 B.测量性偏倚 C.混杂性偏倚 D.信息偏倚 E.失访性偏倚 [参考答案] C.混杂性偏倚 6. 观察指标应具有 A.灵敏性、特异性、准确度、精密度、客观性 B.灵敏性、变异性、准确度、精密度、客观性 C.灵敏性、特异性、变异性、均衡性、稳定性 D.特异性、准确度、稳定性、均衡性、客观性 E.灵敏性、变异性、准确度、精密度、均衡性 [参考答案] A.灵敏性、特异性、准确度、精密度、客观性 7. 为了解某疗法对急性肝功能衰竭的疗效，用12头健康雌性良种幼猪建立急性肝功能衰竭模型，再将其随机分为两组，仅给予实验组该疗法治疗，不给予对照组任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是 A. 空白对照 B. 安慰剂对照 C. 实验对照 D. 标准对照 E. 自身对照 [参考答案] A. 空白对照 8. 实验组与对照组主要不同之处在于 A.处理因素 B.观察指标 C.抽样误差 D.观察时间 E. 纳入、排除受试对象的标准 [参考答案] A.处理因素 9. 实验设计的三个基本原则是 A.随机化、对照、重复 B.随机化、对照、盲法 C.随机化、重复、盲法 D.均衡、对照、重复 E.盲法、对照、重复 [参考答案] A.随机化、对照、重复 10. 实验设计的三个基本要素是 A.处理因素、实验效应、实验场所 B.处理因素、实验效应、受试对象 C.受试对象、研究人员、处理因素 D.受试对象、干扰因素、处理因素 E.处理因素、实验效应、研究人员 [参考答案] B.处理因素、实验效应、受试对象 11. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响，并分析两药的交互作用。你认为该研究最好采用何种实验设计方案？并说明理由。答：该研究最好采用2×2析因设计的实验方案，如表所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义，而且可以检验两因素间有无交互作用。因此本例采用2×2析因设计既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响，又可分析两药合用时的交互效应。 12. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响，并分析两药的交互作用。请帮该研究者实现32只大鼠的随机分组。答：对于2×2析因设计，可采用完全随机化的方法将所有受试对象分到4个处理组。先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行，如第2列最上端开始纵向连续取32个两位数字。对随机数字从小到大排序，事先规定，序号为1~8的豚鼠分为A组，序号为9~16的大鼠分为B组，序号为17~24的大鼠分为C组，序号为25~32的大鼠分为D组 13. 某研究人员欲将12只小鼠按月龄、体重相近的原则配成对，然后将每一对中的小鼠随机分配到实验组和对照组，应如何分组？答：先将6对小鼠按体重从小到大的顺序编号，再从随机数字表中任一行或列，如第18行最左端开始横向连续取12个两位数字。事先规定，每一对中，随机数较小者序号为1，对应于A组，随机数较大者序号为2，对应于B组。 14. 欲将16只豚鼠随机分为两组，某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组，剩下8只作为对照组。该分组方法是否正确？若不正确，请说明理由。答：该分组方法不正确，不是随机分组的方式。随机不等于随便，随机的含义是指每只动物都有相同机会进入实验组或对照组，而该分组方法由于豚鼠活跃程度不相同，进入各组的机会就不同，较活跃的豚鼠进入实验组的机会增大，破坏了随机化原则。 15. 三联药物治疗士兵消化性溃疡”一文中，对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示，痊愈13人，显效14人，进步7人，无效4人，有效率达89.5%。据此认为该三联疗法的疗效较好，且由于其价格适中，可在部队卫生所中推广。该结论是否正确？如果不正确，请说明理由。答：该结论不正确。研究某治疗方案对某疾病的治疗效果需进行临床试验，应遵循实验设计的三个基本原则，即对照、随机化和重复。只有正确设立对照才能较好地控制非处理因素对实验结果的影响，不设立对照往往会误将非处理因素造成的偏倚当成处理效应，从而得出错误的结论。此研究仅纳入了38例消化性溃疡患者，并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年，时间跨度太大，对研究结果造成影响的因素很多，在没有对照的情况下，不能控制非处理因素对试验结果的影响，其研究结论不具有说服力。 16临床试验中使用安慰剂的目的是什么？答：临床试验中使用安慰剂，目的在于控制由于受试对象和试验观察者的心理因素引起的偏倚，提高依从性，还可控制疾病自然进程的影响，显示试验药物的效应。 17. 什么是交叉设计？它有何优缺点？答：交叉设计是一种特殊的自身对照设计，它按事先设计好的实验次序，在各个时期对受试对象先后实施各种处理，以比较处理组间的差异。其中2´2交叉设计是最为简单的一种交叉设计，首先将同质个体随机分为两组，每组先接受一种处理措施，待第一阶段实验结束后，经过适当的时间间隔（即清理阶段），两组再交换处理措施进行第二阶段的实验，这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展，成为多种处理多重交叉实验。交叉设计一般不适用于具有自愈倾向或病程较短的疾病研究。交叉设计的优点有:①节约样本含量；②能够控制个体差异和时间对处理因素的影响；③在临床试验中同等地考虑了每个患者的利益。其缺点有：①处理时间不能太长；②当受试对象的状态发生根本变化时，如死亡、治愈等，后一阶段的处理将无法进行；③受试对象一旦在某一阶段退出试验，就会造成数据缺失，增加统计分析的困难；④不能用于具有自愈倾向或病程较短的疾病研究。 18. 什么是配对设计？它有何优缺点？答：配对设计是将受试对象按一定条件配成对子，再将每对中的两个受试对象随机分配到不同处理组。配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中，常将窝别、性别、体重等作为配对因素；在临床试验中，常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比，其优点在于可增强处理组间的均衡性、提高实验效率；其缺点在于配对条件不易严格控制，当配对失败或配对欠佳时，反而会降低实验效率。在临床试验中，配对的过程还可能延长实验时间。 19. 实验研究中，随机化的目的是什么？答：实验研究中，随机化的目的在于使非处理因素在实验组和对照组中的影响相当，提高对比组间的可比性，使实验结论的外推具有科学性和可靠性。随机化是对数据资料进行统计推断的前提。 20. 实验研究根据对象的不同可分为哪几类？答：根据受试对象不同，实验研究可分为动物实验、临床试验和现场试验三类。动物实验的受试对象可以是动物，或者是器官、细胞、血清等生物材料；临床试验的受试对象通常为患某种疾病的患者，持续时间可以较长，目的在于评价药物或治疗方法的疗效；现场试验的受试对象通常是正常人群，持续时间一般较长，目的是通过干扰某些危险因素或施加某些保护性措施，了解其在人群中产生的预防效果。第四章定量资料的统计描述 1.正态分布曲线下(μ±1.64σ)区间的面积占总面积的 A. 90% B. 95% C. 97.5% D. 99% E. 不能确定 [参考答案] A. 90% 2. 关于均数与标准差，下列说法正确的是 A. 均数可能是负数，标准差不可能 B. 标准差可能是负数，均数不可能 C. 两者都不可能为负数 D. 两者都可能为负数 E. 以上都不对 [参考答案] A. 均数可能是负数，标准差不可能 3. CV越大，表示 A. 资料变异程度越大 B. 资料变异程度越小 C.均数越大 D. 样本含量越大 E. 均数的代表性越好 [参考答案] A. 资料变异程度越大 4.当资料两端含有不确切值时，描述其变异度宜用 A. R B.CV C. S2 D.S E.四分位数间距 [参考答案] E.四分位数间距 5.以下分布形式或资料类型中，适宜用均数与标准差进行统计描述的是 A.正偏态分布 B.负偏态分布 C.对称分布 D.开口资料 E.任意分布 [参考答案] D. 开口资料 6.开医学研究中，反映一组血清抗体滴度资料的平均水平，根据经验，常选用口资料 A.算数均数 B.中位数 C.几何均数 D.众数 E.和 [参考答案] C.几何均数 7.数据分布类型无法确定时，描述集中位置宜选用 A.算数均数 B.中位数 C.几何均数 D.众数 E.和 [参考答案] B.中位数 8.描述一组正态分布资料变量值的平均水平，宜选用 A.变异系数 B.方差 C.几何均数 D.标准差 E.算数均数 [参考答案] E.算数均数 9.频数分布的两个重要特征是 A. 总体与样本 B. 集中趋势与离散趋势 C. 统计量与参数 D. 标准差与标准误 E. 样本均数与总体均数 [参考答案] B. 集中趋势与离散趋势 10.抽样调查某市45~55岁健康男性居民的血脂水平，184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L，s=0.98mmol/L，已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民中，血清总胆固醇在3.25mmol/L~5.25mmol/L范围内的比例。答：45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布，需作标准化变换后，查表确定正态分布曲线下面积。由于是大样本，可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。查标准正态分布曲线下的面积表(附表2)得：该市45~55岁健康男性居民中，血清总胆固醇在3.25 mmol/L~5.25mmol/L范围内的比例为61.79% 11.抽样调查某市45~55岁健康男性居民的血脂水平，184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L，s=0.96mmol/L，已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围答：已知健康人的血清总胆固醇服从正态分布，故采用正态分布法制定95%的参考值范围该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L~6.72mmol/L 12.某省抗癌协会癌症康复会对189名会员进行了生存质量评价，量表包括躯体功能、心理功能、症状不良反应和社会功能四个维度，共计22个条目，总分为220分，得分越高则生存质量越高。资料如下，据此资料计算集中位置指标和离散程度指标。计算结果为：集中位置指标xbar=135.77分，离散程度指标s=30.60分。以上分析是否恰当？为什么？答：大多数观察值集中在较大值一端，呈负偏态分布，故不宜使用均数和标准差。应计算中位数和四分位数间距，计算结果为集中位置指标：M=139分离散程度指标：四分位数间距QU-QL=157-119=38分 13.什么情况下用正态分布法或百分位数法制定医学参考值范围？答：①通过大量调查证实或经正态性检验符合正态分布的指标或近似正态分布的指标，可按正态分布曲线下面积分布的规律制定医学参考值范围；服从对数正态分布的指标，可对观察值取对数后按正态分布法算出医学参考值范围的对数值，然后求其反对数即可；②对于经正态性检验不服从正态分布的指标，应使用百分位数法制定医学参考值范围。 14.何谓医学参考值范围？制定参考值范围的一般步骤有哪些？答：医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标观察值的波动范围，一般用作判定正常和异常的参考标准。制定医学参考值范围的步骤包括确定观察对象和抽取足够的观察单位、统一测定方法、决定是否分组制定参考值范围、确定取双侧或单侧参考值范围、选定适当的百分界限、选择制定医学参考值范围的方法。 15.正态分布有哪些基本特征？答：正态分布的特征：①正态曲线在横轴上方均数处最高；②正态分布以均数为中心，左右对称；③正态分布有两个参数，即位置参数μ和形态参数σ；④正态曲线下的面积分布有一定的规律，正态曲线与横轴间的总面积恒等于1，曲线下区间(μ－1.96σ, μ＋1.96σ)内的面积为95.00%，区间(μ－2.58σ, μ＋2.58σ)内的面积为99.00%。 16.极差、四分位数间距、标准差、变异系数的适用范围有何异同？答：极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点：①极差可用于描述单峰对称分布小样本资料的离散程度，或用于初步了解资料的变异程度；②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度；③标准差用于描述正态分布或近似正态分布资料的离散程度；④变异系数用于比较各组计量单位不同或均数相差悬殊的正态分布资料的离散程度。 17.均数、中位数、几何均数的适用范围有何异同？答：均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中位置。不同点：①均数用于单峰对称分布，特别是正态分布或近似正态分布的资料；②几何均数用于变量值间呈倍数关系的偏态分布资料，特别是经过对数变换后呈正态分布或近似正态分布的资料；③中位数用于不对称分布资料、两端无确切值以及分布不明确的资料。第五章定性资料的统计描述 1 计算标准化率时，宜采用间接法的情况是 A．已知被标准化组的年龄别死亡率与年龄别人口数 B．已知被标准化组的死亡总数与年龄别人口数 C．已知标准组年龄构成与死亡总数 D．已知标准组的人口总数与年龄别人口数 E．被标化组各年龄段人口基数较大 [参考答案] B．已知被标准化组的死亡总数与年龄别人口数 2 下列不属于相对比的指标是 A. RR B. OR C. 病死率 D. CV E. 性别比 [参考答案] C. 病死率 3经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万，但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万，而乙地为93.52/10万，发生此现象最有可能的原因是 A. 甲地的诊断技术水平更高 B. 乙地的恶性肿瘤防治工作做得比甲地更好 C. 甲地的老年人口在总人口中所占比例比乙地多 D. 乙地的老年人口在总人口中所占比例比甲地多 E. 甲地的男性人口在总人口中所占比例比乙地多 [参考答案] C. 甲地的老年人口在总人口中所占比例比乙地多 4.标准化死亡比SMR最初含义是指 A. 实际死亡数/预期死亡数 B. 预期死亡数/实际死亡数 C. 实际发病数/预期发病数 D. 预期发病数/实际发病数 E. 预期发病数/预期死亡 [参考答案] A. 实际死亡数/预期死亡数 5.某地2006年肝炎发病人数占当年传染病发病人数的10.1%，该指标为 A. 率 B. 构成比 C. 发病率 D. 相对比 E. 时点患病率 [参考答案] B. 构成比 6.试就表5-4资料分析比较甲、乙两厂职工的高血压患病率。答：因为甲乙两厂的年龄构成有所不同，为了消除年龄构成的不同对高血压患病率的影响，应先进行标准化再进行比较。根据本题资料，以两厂合计人口为标准人口，已知被标化组的年龄别患病率，采用直接法计算标准化患病率 7.表5-2为一抽样研究资料，试填补空白处数据并根据最后三栏结果作简要分析。答：最后三栏结果的简要分析：恶性肿瘤死亡占总死亡的比例(%)为：各年龄组恶性肿瘤死亡数除以各年龄组总死亡人数后乘100得到的值，表示各年龄组死亡人口中，恶性肿瘤死亡所占的比例。恶性肿瘤死亡率(1/10万)为：各年龄组恶性肿瘤死亡数除以各年龄组总人数后乘100000得到的值，表示各年龄组总人口中，恶性肿瘤死亡出现的频率。年龄别死亡率(‰)为：各年龄组死亡数除以各年龄组总人数后乘1000得到的值，表示各年龄组总人口中，死亡出现的频率。 8.某地人口数：男性13,697,600人，女性13,194,142人；五种心血管疾病的死亡人数：男性16774人，女性23334人；其中肺心病死亡人数：男性13952人，女性19369人。可计算出这样一些相对数，依次说明各指标的含义答： 9.某地1965年和1970年几种主要急性传染病发病情况如表5-1。某医师根据此资料中痢疾与乙脑由1965年的44.2％与3.4％分别增加到1970年的51.9％和5.2％，认为该地1970年痢疾与乙脑的发病率升高。该结论是否正确？为什么？答：该结论不正确。因为该医生所计算的指标是构成比，只能说明不同年份，痢疾与乙脑在几种传染病发病人数中所占的比重发生了变化，不能说明两种传染病感染发生的频率或强度，该医生犯了以构成比代替率的错误。 10.率的标准化需要注意哪些问题？答：①标准化法的目的是为了通过选择同一参照标准，消除混杂因素的影响，使算得的标准化率具有可比性。但标准化率并不代表真实水平，选择标准不同，计算出的标准化率也不相同。因此标准化率是用于相互间的比较，实际水平应采用未标化率来反映。②样本的标准化率是样本指标值，亦存在抽样误差，若要比较其代表的总体标准化率是否相同，需作假设检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化，当已知被标化组的年龄别死亡率时，宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少，年龄别死亡率波动较大时，宜采用间接法。④各年龄组率若出现明显交叉，或呈非平行变化趋势时，则不适合采用标准化法，宜分层比较各年龄组率。此外，对于因其它条件不同，而非内部构成不同引起的不可比性问题，标准化法难以解决。 11.常用动态数列分析指标有哪几种？各有何用途？答：常用的动态数列分析指标有：绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值；发展速度与增长速度都是相对比指标，用以说明事物现象在一定时期的速度变化；平均发展速度是指一定时期内各环比发展速度的平均值，用以说明事物在一定时期内逐年的平均发展程度；平均增长速度是说明事物在一定时期内逐年的平均增长程度。标准化率计算的直接法和间接法的应用有何区别？对死亡率的年龄构成标准化，当已知被标化组的年龄别死亡率时，宜采用直接法计算标准化率；当不知道被标化组的年龄别死亡率，只有年龄别人口数和死亡总数时，可采用间接法。 12.为什么不能以构成比代替率？答：率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比，用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比，以说明事物内部各组成部分所占的比重，不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆，要注意区别。 13.应用相对数时需要注意哪些问题？答：①计算相对数应有足够的观察单位数；②分析时不能以构成比代替率；③计算观察单位数不等的几个率的合计率或平均率时，不能简单地把各组率相加求其平均值而得，而应该分别将分子和分母合计，再求出合计率或平均率；④相对数的比较应注意其可比性，如果内部构成不同，应计算标准化率；⑤样本率或样本构成比的比较应作假设检验；⑥某些情况下只能使用绝对数。第六章总体均数的估计 1.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg，标准差为11.2 mmHg，从该地随机抽取20名35岁以上正常成年男性，测得其平均收缩压为112.8 mmHg，又从该地随机抽取10名7岁正常男孩，测得其平均收缩压为90.5mmHg，标准差为10.4 mmHg，7岁正常男孩收缩压的总体均数的95%置信区间为 A．90.5±1.96×10.4 B．90.5±t0.05/2,9×10.4/Ö10 C．120.2±1.96×10.4 D．120.2±t0.05/2,9×10.4 E．120.2±t0.05/2,9×10.4/Ö10 [参考答案] B．90.5±t0.05/2,9×10.4/Ö10 2.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg，标准差为11.2 mmHg，从该地随机抽取20名35岁以上正常成年男性，测得其平均收缩压为112.8 mmHg，又从该地随机抽取10名7岁正常男孩，测得其平均收缩压为90.5mmHg，标准差为10.4 mmHg，则下列说法正确的是 A．112.8mmHg与120.2mmHg不同是由于系统误差 B．112.8mmHg与120.2mmHg不同是由于两总体均数不同 C．90.5mmHg与112.8mmHg不同是由于抽样误差 D．90.5mmHg与120.2mmHg不同是由于抽样误差 E．90.5mmHg与112.8mmHg不同是因为两总体均数不同 [参考答案] E．90.5mmHg与112.8mmHg不同是因为两总体均数不同 3.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg，标准差为11.2 mmHg，后者反映的是 A．个体变异的大小 B．抽样误差的大小 C．系统误差的大小 D．总体的平均水平 E．样本的平均水平 [参考答案] A．个体变异的大小 4.总体均数的95%置信区间的含义是 A．总体95%的个体值在该区间内 B．样本95%的个体值在该区间内 C．平均每100个总体均数，有95个在该区间内 D．平均每100个样本(样本含量相同)均数，有95个在该区间内 E．平均每100个样本(样本含量相同)，有95个样本所得的区间包含总体均数 [参考答案] E．平均每100个样本(样本含量相同)，有95个样本所得的区间包含总体均数。 5.关于置信区间，下列叙述中错误的是 A．99%置信区间优于95%置信区间 B．置信区间的精确度反映在区间的长度 C．当样本含量确定时，准确度与精确度是矛盾的 D．置信区间的准确度反映在置信度1-a的大小上 E．当置信度1-a确定时，增加样本含量可提高精确度 [参考答案] A．99%置信区间优于95%置信区间 6.从同一总体中随机抽取多个样本，分别估计总体均数的95%置信区间，则精确度较高的是 A．均数大的样本 B．均数小的样本 C．标准差小的样本 D．标准误大的样本 E．标准误小的样本 [参考答案] E．标准误小的样本 7.关于t分布，下列叙述错误的是 A．分布是以0为中心，左右对称的一簇单峰曲线 B．自由度越小，曲线越低平 C．当自由度为¥时，t分布就是标准正态分布 D．自由度相同时，|t|越大，其尾部概率值P越小 E．自由度越大，尾部概率相同时，t界值越大 [参考答案] E．自由度越大，尾部概率相同时，t界值越大 8.表示均数抽样误差大小的统计指标是 A．全距 B．标准差 C．标准误 D．变异系数 E．四分位数间距 [参考答案] C．标准误 9. 某实验室随机测定了100名正常成人血浆内皮素(ET)含量(ng/L)，得均数为81.0(ng/L)，标准差18.2(ng/L)。①计算抽样误差；②试估计正常成人ET含量(ng/L)总体均数的95%置信区间。答：①标准误为1.82；②由于该样本为大样本, 故用公式估计正常人ET含量的95%置信区间为(77.38, 84.60)ng/L。 10. 从某疾病患者中随机抽取25例，其红细胞沉降率(mm/h)的均数为9.15，标准差为2.13。试估计其总体均数的95%置信区间和99%置信区间。答：由于该样本为小样本，故用公式估计总体均数95%置信区间为(8.27,10.03)mm/h；估计总体均数99%置信区间为(7.96, 10.34)mm/h。 11. 2005年随机抽取某市400名7岁男孩作为研究对象, 计算得其平均身高为122.5 cm, 标准差为5.0 cm。请估计该市7岁男孩身高的总体均数。某学生的回答如下：“该市2005年7岁男孩平均身高的点估计值为122.5 cm，按公式计算得到其总体均数的95％置信区间为(112.7, 132.3) cm”。请问该学生的回答是否恰当？为什么？答：该学生误用医学参考值范围的公式来计算总体均数的95%置信区间。医学参考值范围与均数的置信区间的主要区别在于，计算医学参考值范围时应该用标准差，计算置信区间时应该用标准误。此例中样本含量较大，可用Z值代替t值，故置信区间的计算公式为。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.0，123.0）cm。 12. 如何运用抽样分布规律估计总体均数？答：数理统计的中心极限定理：从均数为m，标准差为s的正态总体中进行独立随机抽样，其样本均数服从均数为m，标准差为s/Ön的正态分布；即使是从非正态总体(均数为m，标准差为s)中进行独立随机抽样，当样本含量逐渐增加时，其样本均数的分布逐渐逼近于均数为m，标准差为s/Ön的正态分布。标准误越大，抽样误差越大，由样本均数估计总体均数的可靠性越小。反之，标准误越小，抽样误差越小，由样本均数估计总体均数的可靠性越大。 13. 阐述标准差与标准误的区别与联系。答：标准差与标准误的区别与联系，见表6-1： 14.样本均数的抽样分布有何特点？答：样本均数的抽样分布的特点有：①各样本均数未必等于总体均数；②样本均数之间存在差异；③样本均数基本服从正态

展开阅读全文