资源描述
完美.格式.编辑
简答题
1. 欲研究广东省 6 岁儿童的身高情况, 在广东省随机抽取了 200 名 6 岁儿童进行调查,以此为例说 明同质、变异、总体与样本这几个概念。
答:同质体现在同为广东省、同为 6 岁儿童,变异体现在 200 名儿童的身高不同。
总体是指所有广东省 6 岁儿童,样本为 200 名 6 岁儿童。
2.卫生统计工作中的统计资料主要的来源有哪些?
答:①统计报表。②经常性工作记录。③专题调查或实验。
3.简述统计工作全过程的四个步骤。
答:研究设计、收集资料、整理资料、统计分析。
4.试举例说明常见的三种资料类型。
答:(1).计量或测量或数值资料,如身高、体重等。
(2).计数或分类资料,如性别、血型等。
(3).等级资料,如尿蛋白含量-、+、++、+++、…。
5. 统计学上的变异、变量、变量值是指什么?
答:变异:每个观察个体之间的测量指标的差异称为变异。
变量: 表示个体某种变异特征的量为变量。
变量值:对变量的测得值为变量值。
6. 简述编制频数表的步骤与要点。
答:(1)找出最大和最小值,计算极差。
(2)确定组距和列出分组计划:
第一组应包括最小值;最末组应包括最大值,并闭口。
(3)将原始数据整理后,得到各组频数。
7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?
答:常用描述平均水平的平均数有算术均数、几何均数和中位数。
算术均数适合:对称资料,最好是近似正态分布资料。
几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。
中位数适合:数据非对称分布、分布不清楚或开口资料的情形。
8. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?
答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。
极差适合:数据分布非对称的情形。
四分位数差距适合:数据分布非对称的情形。
方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。
变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较 无可比性,适用变异系数比较。
9. 统计描述的基本方法有哪些,各自有何特点?
答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。
表:详细、精确。图:直观。指标:综合性好。
10.简述变异系数的实用时机。
答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
11. 怎样正确描述一组计量资料?
答:(1).根据分布类型选择指标。
(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料
选用中位数与四分位数间距。
12. 正态分布的主要特征有哪些?
答:(1)正态曲线在横轴上方均数处最高。
(2)正态分布以均数为中心,左右对称。
(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。
(4)正态曲线下的面积分布有一定规律。
13. 参考值范围是指什么?
答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。
“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。
14. 简述估计参考值范围的步骤与要点。
答:设计:①样本: “正常人” ,大样本 n≥100。②单侧或双侧。③指标分布类型。
计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。
15.简述正态分布的用途。
答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。
16.简述可信区间在假设检验问题中的作用。
答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率 P 值。故将二者结合起来,才是对假设检验问题的完整分析。
17. 假设检验时,当 P≤ 0.05,则拒绝 H0,理论依据是什么?
答:P 值为 H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当 P≤0.05 时,说明在H0 成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可 能在一次试验中发生,所以拒绝 H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯 错误的概率不会大于0.05,也就是说,有了概率保证。
18. 假设检验中与 P 的区别何在?
答:以 t 检验为例,与 P 都可用 t 分布尾部面积大小表示,所不同的是:值是指在统计推 断时预先设定的一个小概率值,就是说如果 H0是真的,允许它错误的被拒绝的概率。P 值是由实际 样本获得的,是指在 H0 成立的前提下,出现大于或等于现有检验统计量的概率。
19. 什么叫两型错误?作统计学假设检验为什么要加以考虑?
答:如果 H0 正确,检验结果却拒绝 H0,而接受 H1,则犯 I型错误,记为α;
如果 H0 错误,检验结果却不拒绝 H0,未能接受 H1,则犯 II型错误,记为β。
一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本
含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论 时,都要考虑到两型错误。
20. 配对比较是不是就比成组比较好?什么情况下用配对比较比较好?
答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不 是说凡是配对试验就一定比成组比较好。 实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的 个体间相似程度更高。
21. t 检验有几种?各适用于哪些情况?
答:t 检验以 t 分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种:
一是样本均数与总体均数比较的 t 检验。即将一个样本均数X与一已知的总体均数作比较;
二是配对资料的 t 检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。
三是两个样本均数比较的 t 检验;两组的样本量可以不相同。
此外尚有相关系数、回归系数的 t 检验。
22. 什么叫假设检验?医学研究中常用的假设检验有哪些?
答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤 是:①提出检验假设 0 H ,确定单双侧与检验水准α;②计算检验统计量;③确定概率 P 值;④判 断结果。 在医学研究中常用的显著性检验有 u 检验、t 检验、F 检验、 2 c 检验及非参数秩和检验等多种,不 论那种检验均以假设成立时得到的统计量的概率来判断。
23.通过实例说明为什么假设检验的结论不能绝对化?
答:统计的结论为概率性的结论。拒绝 H0 时,可能犯Ⅰ型错误。不拒绝 H0 时,可能犯Ⅱ型错误。
24. 方差分析的检验假设(H0)是什么?
答:各总体均数相等
25. 方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?
答:总的离均差平方和等于各部分离均差平方和之和. 总的自由度等于各部分自由度之和. 完全随机设计: SS 总=SS 组内+SS 组间 V 总=V 组内+V 组间
随机区组设计: SS 总=SS 组内+SS 处理组间+SS 区组间
V 总=V 组内+V 处理组间+ V 区组间
26. 三组均数比较时,为什么不能直接作一般的两两均数比较的 t 检验?
答:增大犯第一类错误的可能性.
27. 两组均数差别的假设检验能否作方差分析,为什么?
答:可以.方差分析与 t 检验关系:k=2 时,F=t 2 , P 值相等,即两检验等价。
28. 方差分析中,组间变异是来源于那些方面的变异?
答:该变异除随机原因的影响外,有可能存在处理因素的作用。
29. 对多组均数作方差分析的主要步骤和结果有那些?
答:(1)建立检验假设和检验水准
(2)计算统计量 F 值(列出方差分析表)
(3)确定 P 值和作出推断结论
(4)作两两均数之间的比较(若 P>0.05 则可省略此步骤)
30.方差分析的基本思想是什么?
答:方差分析的基本思想: 就是根据资料设计的类型及研究目的, 可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。
31.为什么不能以构成比代率?
答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
32.简述相对数标准化的基本思想。
答:基本思想: 采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的 标准化死亡率具有可比性。
33 解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?
答: 率的直接标化法:已知各组的年龄别死亡率pi。间接标化法:已知各组的死亡总数和各年龄组人口数.
34.率的直接标化法,与间接标化法有何不同?
答: (1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成” 。 后者选定一套“标准年龄别死亡率” 。
35.应用相对数时应注意哪些问题?
答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较 时应做假设检验。
36.常用相对数指标有哪些? 它们的意义上有何不同?
答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或 强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。
37.统计学上资料是否“具有可比性”指的是什么? 你能举出一些不可比的例子吗?
答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时 间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。
38. 二项分布、Poisson分布各有哪些特征?
答:二项分布和 Poisson 分布都是离散型分布。
二项分布的形状取决于与 n 的大小:=0.5 时,不论 n 大小,分布对称。≠0.5时,图形呈偏态,随n 的增大,逐渐对称。当 n足够大, 或 1-不太小,二项分布 B(n,)近似于正态分布 N( n, n(1-) )。
Poisson 分布:值愈小分布愈偏,愈大分布趋于对称,当足够大时,分布接近正态分布 N(, )。
39. 简述二项分布、Poisson分布、正态分布的关系。
答:当 n 足够大,或 1-不太小时,二项分布近似于正态分布。当 n 足够大,或 1-很小时,二项分布近似于 Poisson分布。较大时,Poisson 分布近似于正态分布。
40. 二项分布的应用条件是什么?
答:⑴每次试验有且仅有两个互相排斥的结果(A或非 A)。
⑵每次试验中,发生 A的概率相同,均为π。
⑶各次试验独立,即 n 次观察结果相互独立。
41.检验的用途有哪些?
答:主要适用于计数资料,(1)两个及两个以上的率或构成比的比较(2)交叉分类资料两属性间的 关联性检验(3)频数分布的拟合优度。
42. 以下表资料说明χ 2 检验的基本思想。(不用计算)
答:基本思想:假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑 H0 是否成立。完全符合则为 0 或特别小,x 2 值越小,越支持 H0。
43. 四格表资料检验的条件有哪些?
答:T<1 或 n<40 确切概率法
n≥40 但有 1£T<5 要校正
n≥40 并且 T>5 不必校正
44.某病的发病率对全国人口来说是 8.72%,现在某县回顾一年,抽样调查了 120 人,有 16人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作检验,你认为应该用什么方法?
答:不能,用单样本率比较的u检验。
45. 请指出非参数检验与参数检验相比的优、缺点。
答:非参数检验适用范围广,收集资料、统计分析也比较方便。但检验效率没有参数检验高,犯第 二类错误的概率较大。
46. 简述参数检验与非参数检验的定义及两者的区别。
答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特 点:依赖于特定的分布类型,比较的是参数。 非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布 或分布位置,而不是参数。
47. 简述配对比较秩和检验的编秩方法。
答:求差值,差值编秩;差值 0 删去,相同值取平均秩
48. 配对设计差值的符号秩和检验步骤。
答:(1) H0:差值的总体中位数 Md=0; H1:Md≠0; =0.05
(2)求差值
(3)编秩:依差值的绝对值从小到大秩次。绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。
(4)求秩和确定检验统计量:分别求正、负秩次之和,任取 T+ 或 T—作检验统计量 T,
(5)确定 P 值,作推断结论。
49. 两组比较的秩和检验的编秩方法。
答:将两样本混合编秩次。若有“相同数据” ,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。
50. 对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?
答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的 条件时,必须采用非参数检验方法。
51. 非参数检验的适用范围。
答:①各种资料的初步分析;
②等级资料:某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先后或综合判断等方式定出次序;
③资料分布类型不能确定或偏态分布;
④综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;
⑤组内个别数据偏离过大,或各组内相差悬殊。
52. 两个变量之间的相关系数等于 0,是否说明这两个变量之间没有关系?
答:0 相关不等于无关,因为可能无直线关系但有曲线关系
53.直线回归及其回归方程有何用途?
答:(一)描述 Y 对 X 的依存关系。
(二)预测(forecast): 由自变量 X 估算应变量 Y。 Y 波动范围可按求个体 Y值容许
区间方法计算。
(三)统计控制:控制 Y 估算 X,逆估计。通过控制自变量 X 的取值,满足应变量 Y 在
一定范围内波动。
54.简述作直线相关与回归分析时应注意的事项。
答:(1)回归方程要有实际意义。(2).分析前绘制散点图,考察是否有直线趋势或异常点。(3).
直线回归的适用范围一般以自变量的取值范围为限。没有充分理由 X 的取值不要外延。
55.简述直线回归与直线相关的区别与联系。
答:(一)、区别
(1) 资料要求不同:回归可以有两种情况:
①Y 正态随机,X 为选定变量 ----Ⅰ型回归;
②X、Y 服从双变量正态分布 ---- Ⅱ型回归。
相关: X、Y 服从双变量正态分布。
(2) 应用不同:回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。 相关是 只说明两个变量间是否有关联。
(3) 意义不同:b 表示X 每增(减)一个单位,Y 平均改变 b 个单位;r 说明具有直线关系的两个变 量间关系的密切程度和方向。
(4) 取值范围不同:-∞<b<+∞;-1<a<+1。
(5) 回归系数有单位,相关系数无单位。
(二)、关系
(1)方向一致:对一组数据若同时计算 r 与 b,其正负号一致。
(2)假设检验等价:对同一样本,tr=tb,P值相等。
(3)用回归解释相关: 决定系数 反映 Y 的总变异中有多大可能可由 X 来解释。越接近 1,回归的效果越好。
56. 简述直线相关系数意义。
答:相关系数描述线性相关的密切程度与方向。相关系数没有单位,-1≤r≤1。r> 0 表示正相关; r< 0 表示负相关;|r|=1 表示完全相关; r=0 表示零相关。
57.经检验认为回归方程有意义,表明两变量间存在因果关系,对否?
答:不一定。应联系专业知识考察变量间关系。
58. 用什么方法考察回归直线图示是否正确?
答:直线经过(X ,Y )点。直线与纵轴交点的纵坐标为截距a。直线应在自变量 X 的实测范围内。
59.依次写出箱式图中涉及到的各个取值。
由大到小的次序为:极大值、 75 P 、中位数、 25 P 和极小值。
60.直方图中各矩形的高度等于频数(或频率),对吗?
答:对于各组距相等的情形,该说法是对的。 若某些组段的组距与多数组段所取组距不同时,例如前者是后者的 k 倍,则该不等距组段的高度为 频数(或频率)除以 k。确切地说,组段对应的面积等于频数(或频率)。
61.统计表的列表原则是什么?
答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。
62.线图和半对数线图的主要区别是什么?
答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;
半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。
63.某医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三个基本要素是什么?
答:降压药物为处理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。
64.样本含量估计的要素有哪些?
答: (1)根据研究目的,建立检验假设
(2)定出检验水准,常取0.05
= (3)提出所期望的检验效能
(4)必须知道由样本推断总体的一些信息 ,例如,对于两总体均数的比较,需知道两均数间的差值和总体标准差
65.什么是盲法?举例说明盲法在临床试验中的重要性。
答:为了有效减少实验观察过程中的偏倚,使患者(甚至包括研究者及其他参与者)不知道处理措施的 内容,称为盲法。可有单盲法、双盲法和三盲法。
例如研究某抗神经衰弱药物的疗效,当患者知晓自己所接受的处理措施时,对疗效的评价往往会受 心理因素作用而不够客观。采用盲法,则可以避免疗效测量中可能产生的偏倚。
66.实验设计应当遵循哪些基本的原则?
随机化原则、对照的原则及重复的原则。
67.各举一个配对设计和成组设计的例子。
在评价某降压药物的降压作用时,可以采用以下两种方案。
配对设计:按体重和舒张压相近、性别和窝别相同将40 只大鼠分为 20 对,每对中随机地取其一接受 A药,另一只接受 B 药。服用一个疗程后,比较两组血压改变量的区别,从而考察药物 A和 B 的疗效。
成组设计:将体重和舒张压相近、性别相同的 40 只大鼠随机地分为两组,取其中一组接受 A药,另一组接受 B 药。服用一个疗程后,比较两组血压改变量的平均水平的区别,从而考察药物 A和 B 的疗效。
68.按实验设计的要求和原则,对下列设计加以分析:某医师研究一种新药对慢性支气管炎的近期疗 效,以门诊 30 名病人作为观察对象,以 30 名住院病人服用传统药物作为对照,经过 3 周治疗后,统计结果发现新药症状近控率高于传统药物近控率。
答:门诊病人和住院病人的病情轻重不均衡。假设门诊病人的病情较轻,则近控率较高可能是由于此原 因,从而夸大了新药的作用。 建议门诊病人中随机抽取一半接受新药,另一半接受传统药物。住院病人也随机分为两组接受这两 种处理。然后分别考察两种药物对不同组别的疗效。
69.某研究者欲将 15 只大白鼠随机分配到甲、乙、丙三组,每组 5 例。试由查出的随机数字写出分组结果,并简述分组方法。
答:动 物 号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
随机数字:4 0 9 10 14 5 1 6 2 12 3 11 13 7 8
随机数字对应为 0~4,5~9,10~14 的个体分别分入甲、乙、丙三组,结果动物号 1、2、7、9、11 者分入甲组;动物号 3、6、8、14、15 者分入乙组;动物号 4、5、10、12、13 者分入丙组
70.调查研究的基本抽样方法有那些?按抽样误差由大到小的顺序写出。
答:整群抽样、单纯随机抽样、系统抽样和分层抽样。
71.举例说明开放式问题和封闭式问题的特点。
答:开放式问题未加任何限制,封闭式问题则提供了若干备选项。
例如在调查首次妊娠年龄时,可以采用开放式问题:请填写您首次妊娠的具体年龄;也可以采用封 闭式问题:您首次妊娠的年龄是:①<20 岁②<25 岁③<30 岁④30 及以上。
72.常用的获得原始资料的调查方式有哪些?应答率最低和所得资料最为可靠的方式分别是哪种?
答:直接观察法、直接采访法和间接采访法。
应答率最低的方法是间接采访法,而直接观察法所得资料最为可靠。
73.由无限总体抽样和有限总体抽样时所需的样本含量有何不同?
答:由无限总体抽样时所需的样本含量大于从有限总体抽样。
74.根据调查范围可以将调查方法分为哪些?
答:普查(全面调查)、抽样调查和典型调查(案例调查)。
75.简述常用的四种随机抽样方法。
答:(1) 完全随机抽样,即总体中每一个体有同等的机会被抽中或分配到某一组,如抽签或随机数字表法;
(2) 系统抽样或等距抽样或机械抽样, 首先将总体中的个体按某种顺序编码并分为 n 个组 段,间隔为 k,接着用完全随机方法在第一组段中抽出一个号码,往后各组依次递加 k 个号 码的个体被抽中;
(3) 整群抽样,首先将总体分为 K 群,而后从中抽取 k 个群体作为样本;
(4) 分层随机抽样,首先将总体按个体特征分为 K 层,而后分别从每一层中随机抽样。
76.某市卫生防疫站为验证复方制剂 A(桉叶、板兰根、防风、白芷和葛根等)预防流感的效果,取 城区第一幼儿园的儿童作研究对象,小班儿童为实验组服用制剂 A,大班儿童为空白对照组,不服用任何制剂,结果认为制剂 A无预防流感的作用。试评述该结果。
答:该实验结果是不可靠的,理由是:
(1)流感对全体人群都敏感,仅选择儿童作研究对象是不够的,对成人也应进行研究。
(2)实验组和对照组缺乏可比性,事实上,大班儿童的免疫力及身体素质状况比小班好,即两组的 非处理因素不均衡;
(3)如用该幼儿园作研究对象,应分别将大班和小班分为两半放到实验组和对照组。
77. 何谓人口老龄化?请简述其影响因素。
答 1:人口老龄化是指老年人口(65 岁及以上)在人口中所占的比重升高的现象。在没有迁移的 情况下,人口老龄化的进程主要受生育率和死亡率两种因素的影响。生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率(主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加。一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度。当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显。
78. 发病率、时点患病率、时期患病率的区别。
答:(1)发病率是指观察期内,可能发生某病的人群中新发病例的频率,其观察期多为年、月、日等,急性常见病多计算发病率。
(2)时点患病率反映在检查或调查时点一定人群中某病的现患情况(包括该病的新旧病例数)。观 察时点在理论上是无长度的,但实际上观察时间不宜过长,一般不超过个月。
(3)时期患病率反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新发病例和现 患病例数,为慢性病的统计指标。
79. 疾病统计的观察单位 “病人”和“病例”的区别。
答:(1)一个人每次患病都可作为一个病例。以病例为单位的疾病统计,可研究居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律。
(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种 类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体 的患病人群,便于开展对病人个人的防治工作。
80. 病死率和死亡率的区别。
答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:
观察期内因某病死亡的人数 某病病死率= 同期该病患者数 ×1000‰
(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代 某种疾病的死亡水平。计算公式为:
观察期内因某病死亡的人数 某病死亡率= 同期平均人口数 ×1000‰
81. 简述婴儿死亡率指标的实际意义
答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。
婴儿死亡率= 某年不满周岁婴儿死亡数 ×1000‰ /同期活产数
婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指 标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以 相互比较。
82.平均寿命与平均死亡年龄的区别?
答:平均寿命是指 0岁组预期寿命,仅取决于年龄组死亡率的高低,两地的平均寿命可直接进行比较。平均死亡年龄是指死者死亡时年龄的算术均数,不仅取决于年龄组死亡率的高低,也取决于年龄别人口构成,两地的平均死亡年龄不能直接进行比较。
83.简略去死因寿命表的作用。
答:研究某种死因对居民死亡的影响,可编制去死因寿命表。其基本思想是,假使消除了某种死因,则原死于该原因的人不死于该原因,寿命就会有所延长。显然,如果消除了对生命威胁大的死因,寿命就会延长更多。去死因寿命表的优点是:①以某死因耗损的预期寿命和尚存人数合理地说明了该死因对人群生命的影响程度。②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用。 ③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。
84. 简述寿命表中的几个主要指标。
答:寿命的各项指标 X l 、 X n d 、 X n q 、 X e , 都用来评价居民的健康水平。其中最主要的指标是平均预期寿命。 寿命表尚存人数:反映在一定年龄组死亡率基础上,一代人口的生存过程,一般用线图表示。 尚存人数随年龄增加而减少。寿命表死亡人数:反映在一定年龄组死亡基础上,一代人口的死亡过程。一般用直方图表示。横坐标为年龄,纵坐标为死亡人数。 寿命表死亡概率:取决于各年龄组死亡率,一般用半对数线图表示。 预期寿命:预期寿命是评价居民健康状况的主要指标。一般用线图表示。
85. 简述寿命表的用途。
答: 寿命表主要应用于:(1)评价国家或地区居民健康水平。(2)利用寿命表研究人口再生产情 况。(3)利用寿命表指标进行人口预测。(4)利用寿命表方法研究人群的生育、发育及疾病的发展规律。
86. 全死因寿命表可分为哪几类,哪类更常用。
答:寿命表是根据某地特定人群的年龄组死亡率编制而成的。一般可分为定群寿命表和现时寿命表。由于人的生命周期很长,用定群寿命表的方法去研究人群的生命过程,不仅随访人数要很多, 而且随访时间要数十年。因此,在编制寿命表时,一般不使用定群寿命表,而是使用现时寿命表。现时寿命表是假定同时出生的一代人(一般为 10 万),按照某年(或某一时期内)特定人群的年龄 组死亡率先后死去,直至死完为止,用寿命表方法计算出这一代人在不同年龄组的“死亡概率”、“死 亡人数” 、刚满某年龄时的“尚存人数”及其“预期寿命”等指标。这些指标不受人群年龄构成的影 响,不同的地区可以相互比较。 根据年龄分组方法的不同,现时寿命表可分为完全寿命表及简略寿命表两种。完全寿命表年龄 分组的组距是 1 岁,而简略寿命表习惯上将年龄组距定为 5 岁。因为婴儿死亡率对寿命表的影响相 当大, 所以简略寿命表也将第 1 个 5岁年龄组拆分为组距为 1 岁的 “0~” 岁组和组距为 4 岁的 “1~” 岁组,从 5 岁开始年龄组距才为 5 岁。
87.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?
答:当作截尾数据处理。
88. 生存分析可用于发病资料的分析吗?请举例说明。
答:可用于慢性病的发病资料分析。
89.生存时间能计算平均数、标准差吗?
答:.因为这类资料常包含截尾数据,并且常为非正态分布,所以一般不可以计算均数和标准差,应计算半数生存时间。
90.Cox 回归可估计参数,故属于参数方法?
答.属于半参数模型
91. 简述生存资料的基本要求。
答: 生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不
能太少;③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。
医学统计学
第一章 绪论
一、名词解释:
1. 同质与变异
2. 总体和样本
3. 参数和统计量
4. 抽样误差
5. 概率
6. 计量资料
7. 计数资料
8. 等级资料
二、是非题:
1.用定性的方法得到的资料称作数值变量资料,亦称作计数资料。 ( )
2.观察某人群的血型,以人为观察单位,结果分为A型、B型、AB型和O型,是有序
分类资料。 ( )
3.分类变量或称定量变量,其变量值是定量的,表现为数值大小,一般有度量衡单位,亦称计量资料。 ( )
4.调查某地10岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm)、
体重(kg)、血 压(mmHg),此资料称为多项分类变量资料。 ( )
5.用定量的方法测定观察单位某个量的大小的资料,称数值变量资料。 ( )
7.等级分组资料兼有计数与计量资料的性质。 ( )
8.将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资
料。 ( )
三、单选题:
1. 计量资料﹑计数资料和等级分组资料的关系有
A.计量资料兼有计数资料和等级分组资料的一些性质
B.计数资料兼有计量资料和等级分组资料的一些性质
C.等级分组资料兼有计量资料和计数资料的一些性质
D.计数资料有计量资料的一些性质
E.等级分组资料又可叫半计数资料
2. 为了由样本推断总体,样本应该是
A.总体中任意一部分 B.总体中的典型部分
C总体中有意义的一部分 D.总体中有价值的一部分
E.总体中有代表性的一部分
3. 统计学上所说的系统误差﹑测量误差和抽样误差三种误差,在实际工作中有
A.三种误差都不可避免 B.系统误差和测量误差不可避免
C.系统误差和抽样误差不可避免 D.测量误差和抽样误差不可避免
E.三种误差都可避免
4. 抽样误差指的是
A.个体值和总体参数值之差 B.个体值和样本统计量值之差
C.样本统计量值和总体参数值之差 D. 总体参数值和总体参数值之差
5. 医学统计工作的基本步骤是
A. 调查资料﹑校对资料﹑整理资料 B.调查资料﹑归纳资料﹑整理资料
C.收集资料﹑校对资料﹑整理资料 D.收集资料﹑整理资料﹑分析资料
E.收集资料﹑校对资料﹑归纳资料
6. 统计学中所说的总体是指
A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体
C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体
E.根据人群划分的研究对象的全体
答案
名词解释:
(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p表示
(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:
1. ×
2. ×
3. ×
4. ×
5. √
6. √
7. ×
单选题:
1. C
2. E
3. D
4. C
5. D
6. B
第二章 计量资料统计描述及正态分布
一、 名词解释:
平均数
标准差
标准正态分布
参考值范围
二、 填空题:
1、 医学统计资料按研究指标的性质分为________、________和_________三类。
2、 统计工作的全过程按顺序可分为四个步骤,即_________、_________、________和__________。
3、 正态分布用N(μ,2)表示,为了应用方便,常对变量X作___________变换,使μ=0 ,=1,则正态分布转变为___________分布,用___________表示。
4、 正态曲线下面积的分布有一定规律,理论上___________、___________和___________,区间的面积(观察单位数)各占总面积(总观察单位数)的___________、___________和___________可用于估计医学参考值范围和质量控制方面。
5、 标准正态曲线下,区间(-1.96,0)的面积占总面积的___________%。
6、 用___________和___________可全面描述正态分布资料的特征。
7、 为了说明离散程度应选用变异指标,常用的变异指标有___________、___________、___________和___________。
8、 ___________范围内
展开阅读全文