天津医科大学卫生统计学.doc-资源下载-咨信网-让知识获取变得高效

天津医科大学卫生统计学.doc

1、卫生统计学第一章绪论一，名词解释 1. 参数：能统计计算出来描述总体的特征量，即总体的统计指标。 2. 总体：根据研究目的确定的同质研究对象的全体集合。 3. 同质：除了实验因素外，影响被研究指标的非试验因素相同被称为同质。 4. 变异：在同质的基础上被观察个体或单位之间的差异被称为变异。 5. 样本：从总体中随机抽取的部分研究对象。 6. 统计量：由观察资料计算出来的量，即样本的统计指标。 7. 概率：表示一个事件发生的可能性大小的数。（概率的统计定义：在一定条件下，重复做n次试验，nA为n次试验中事件A发生的次数，如果随着n逐渐增大，频率nA/n逐渐稳定在某一数

2、值p附件，则数值p称为事件A在该条件下发生的概率。） 8. 抽样误差：由抽样造成的样本均数与总体均数或各样本均数之间的差异。二，问答题。 1. 统计学的基本步骤有哪些？答：统计学是一门处理数据中变异性的科学与艺术，它包括收集数据、分析数据、解释数据，以及表达数据。 2. 总体与样本的区别与关系？答：区别：样本是总体的一部分，联系：如果样本的均衡性较好，就能够代表总体的特征。 3. 抽样误差产生的原因有哪些？可以避免抽样误差吗？答：一，个体差异引起；二，抽样方法引起。抽样误差不能避免，但可以随着样本含量的增大而减小。 4. 何为概率及小概率事件？答：概率是指在一定条

3、件下，重复做n次试验，nA为n次试验中事件A发生的次数，如果随着n逐渐增大，频率nA/n逐渐稳定在某一数值p附件，则数值p称为事件A在该条件下发生的概率。小概率事件是指习惯上将P《=0.05或P《=0.01称为小概率事件，表示某事件发生的可能性很小。第二章定量资料的统计描述一，名词解释 1. 频数：对一个随机事件进行反复观察，其中某变量值出现的次数被称为频数。 2. 方差：用来度量随机变量和数学期望（即均值）之间的偏离程度。 3. 标准差：也称均方差，是各数据偏离平均数的距离的平均数。 4. 中位数：是指将原始观察值从小到大或从大到小排序后，位次局中的那个数。 5. 几何

4、均数：变量对数值的算数均数的反对数。 6. 四分位间距：百分位数P75和百分位数P25之差。 7. 正偏态分布：偏态分布是相对于正态分布而言的，如果频数分布的高峰向左偏移，长尾向右侧延伸为正偏态分布也叫右偏态分布。 8. 负偏态分布：偏态分布是相对于正态分布而言的，如果频数分布的高峰向右偏移，长尾向左延伸则成负偏态分布，也叫左偏态分布。 9. 变异系数：是衡量资料中各观测值变异程度的一个统计量，用标准差与平均数的比值来表示。二，问答题。 1. 描述数值变量资料集中趋势的指标有哪些？其适用范围有哪些？答：常见的包括算术均数、几何均数、中位数。相同点：算数均数和中位数都适用于正

5、态分布的资料。不同点：几何均数适用于可经对数转换为对称分布的资料；中位数适用于各种分布的资料，常用于描述偏锋分布的资料。 2. 描述数值变量资料离散趋势的指标有哪些？其适用范围有何异同？答：常见的包括：极差、四分位间距、方差、标准差和变异系数。适用范围相同点：极差和四分位间距可用于各种资料的分布；方差和标准差适用于对称分布，特别是正态分布的资料。不同点：极差易受样本含量的影响，很不稳定；四分位间距特别适用偏锋分布资料；变异系数适用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。卫生统计学课本第二章习题，第3题答案该资料最大值为一不确定值，根据此特点，宜用中位数和四分位数

6、间距进行统计描述。M=16.5（天）；P25=15（天）；P75=20（天）；Q=20-15=5（天）。第三章定性资料的统计描述一，名词解释 1. 率：指某现象实际发生数与可能发生该现象的观察单位总数之比，用以说明某现象发生的频率或强度。 2. 构成比：是指事物内部某一组成部分观察单位数与事物内部各组成部分观察单位总数之比，常用百分数表示。 3. 相对比：是指两个有关指标之比，用以说明一个指标是另一个指标的几倍或几分之几。 4. 人口金字塔：是将人口的性别和年龄资料结合起来，以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴，人口数构成为横轴，左侧为男，右侧为女而绘制的两个

7、相对应的直方图，可以分析过去人口的出生死亡情况以及今后人口的发展趋势。 5. 标准化率：寻找一个统一的分布作为标准组，然后每个比较组均按该分布标准计算相应的率，所得到的率是相对于标准组的，故称为标准化率。 6. 标化死亡比：实际死亡人数与期望死亡人数之比。 7. 期望寿命：指0岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下，已经活到X岁年龄的人们平均还有可能继续存活的年岁数。 8. 动态数列：按时间顺序将一系列统计指标（可以为绝对数，相对数或平均数）排列起来，用以观察和比较该事物在时间上的变化和发展趋势。三，问答题 1. 请说明频率型指标与强度型指标的主要区别？答：主

8、要区别：指标的解释不同，频率型指标是表示事物内部某个组成部分所占的比重或分布，或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。 2. 标准化法的基本思想？答：采用统一标准构成以消除某因素的内部构成不同对总率的影响，使通过标准化后的标准化率具有可比性。 3. 请比较发病率和患病率的不同。答：发病率表示一定时期内，在可能发生某病的一定人群活过的总人年中，新发生的某病病历数，其分子是新病历数，分母是总人年数；患病率，又称现患率，指某时点上受检人数中先患某种病的人数，通常用于描述病程较长或发病时间不易明确的疾病的患病情况，其分子包括新旧病例数，分母是受检总人数。在一定的人群

9、和时间内，发病率和患病率有密切关系，两者与病程（D）的关系是：PR=IR×D。 4. 请比较死亡率与病死率的不同。答：死亡率与病死率的分子是一样的，均表示因某病死亡的人数，但死亡率的分母是总人年数，侧重反映发生的强度，或单位时间内死亡的概率；病死率的分母是患某病的人数，反映疾病死亡的概率。 5. 应用相对数应注意的事项。答：1.理解相对数的含义不可望文生义；2.频率型指标的解释要紧扣总体和属性；3.计算相对数时分母应有足够数量；4.正确地合并频率（强度）型指标；5.相对数间的比较要具备可比性；6.对相对数的统计推断。 6. 应用标准化的注意事项。答：1.标准化的应用范围很广，

10、适用于“某事件的发生率”可以是治愈率，也可以是患病率，还可以是发病率、病死率等。当某个分类变量在两组中分布不同时，这个分类变量就成为两组频率比较的混杂因素，标准化法的目的就是消除这个混杂因素的影响。第四章统计表与统计图二，问答题 1. 依次写出箱式图中涉及到的各个取值。答：由大到小的次序为：极大值、P75、中位数、P25和极小值。 2. 直方图中各矩形的高度等于频数（或频数），对吗？答：对于各组距相等的情形，该说发是对的。若某些组段的组距与多数阻段所取组距不同时，例如前者是后者的k倍，则该不等距组段的高度为频数（频率）除以k。确切地说，组段对应的面积等于频数（

11、频率）。 3. 统计表的列表原则是什么？答：一是重点突出，简单明了；二是主谓分明，层次清楚，符合逻辑。 4. 线图和半对数线图的主要区别是什么？答：线图的纵轴尺度为算术尺度，用以表示某指标随时间的变化趋势；半对数线图的纵轴尺度为对数尺度，用以表示某指标随时间的增长或减少速度。第五章常用概率分布一，名词解释 1. 正态分布：是一种很重要的连续型分布，以均数为中心，左右两侧对称，靠均数两侧的频数较多，离均数越远，频数越少，形成钟形分布。 2. Poisson分布：是一种离散型分布，用以在单位时间、空间、面积等的罕见时间发生次数的概率分布。 3. 二项分布：对只有两种互

12、斥结果的离散型随机事件的规律性进行描述的一种概率分布。 4. 医学参考值范围：是指特定的“正常”人群（排除了对所研究指标有影响的疾病和有关因素的特定人群）的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。二，问答题 1. 医学参考值范围确定的方法是什么？答：百分位数法和正态分布法。 2. 简述二项分布、Poisson分布、正态分布的区别与联系。答：区别：二项分布、Poisson分布是离散型概率分布，用概率函数描述其分布状况，而正态分布是连续型概率分布，用密度函数和分布函

13、数描述其分布状况。联系：Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1—π都不是很小的时候二项分布渐近正态分布，当λ》=20的时候Poisson分布渐近正态分布。 3. 控制图的基本原理。答：如果某一波动仅仅由个体差异或随机测量误差所致，那么观察结果服从正态分布；依据标准正态分布曲线下面积的分布规律性，确定出现概率非常小的若干情况作为异常标准吗如果出现相应结果则判为异常。 4. 二项分布的特征？答：二项分布图的高峰在μ=nπ处或附近；π为0.5时，图形是对称的；当π不等于0.5时，分布不对称，且对同一n，π离0.5愈远，对称性愈差。对同一π，随着n的增大，分布

14、趋于对称。当n→∞时，只要π不太靠近0或1，二项分布趋于对称。 5. Poisson分布的特征？答：（1）Poisson分布的总体均数与总体方差相等，均为λ。（2）当λ较小时，图形呈偏态分布；当λ较大时，图形呈正态分布。（3）Poisson分布的观察结果具有可加性。 6. 正态分布曲线的位置与形状的特点？答：（1）关于χ=μ对称。（2）在χ=μ处取得该概率密度函数最大值，在χ=μ±σ处有拐点。（3）曲线下面积为1。（4）μ决定曲线在横轴上的位置，μ增大，曲线沿横轴向右移；反之，μ减小，曲线沿横轴向左移。（5）σ决定曲线的形状，当μ恒定时，σ越大，数据越分散，曲线越“矮胖”

15、 σ越小，数据越集中，曲线越“瘦高”。第六章参数估计基础一，名词解释 1. 标准误（standard error）：样本均数的标准差，即均数的标准误。 2. 可信区间：按一定的概率或可信度（1－α）用一个区间来估计总体参数所在的范围，该范围通常称为参数的可信区间或者置信区间。 3. t分布：在实际的工作中，往往σ是未知的，常用s作为σ的估计值，为了与μ变换区别，称为t变换，统计量t值的分布称为t分布。二，问答题 1. t分布图形的特征？答：（1）单峰分布，以0为中心，左右对称；（2）ν越小，t值越分散，曲线的峰部越矮，尾部越高；（3）随着ν逐渐增大，t分布逐渐接

16、近标准正态分布；当ν趋向∞时，t分布趋近标准正态分布。 2. 总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响？答：无论原始数据的总体分布形态如何，即对于任意分布而言，在样本含量足够大时，其样本均数的分布近似于正态分布，且样本均数的均数等于原分布的均数，样本均数的标准误有公式（6-1）计算。 3. 样本均数的标准误的意义是什么？与原变量的标准差有何区别与联系？答：样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别：（1）前者表示均数变异的指标，后者是表示观察值变异的指标。（2）用途不同，标准差与均数结合估计参考值范围，计算变异系数，和标准

17、误等；标准误用于估计参数的可信区间，进行假设检验等。(3)它们与样本含量n的关系不同，当样本含量n足够大时，标准差趋向稳定，而标准误随的增大而减小。联系：当样本量n一定时，标准误随标准差的大小而变化。 4. 用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间，哪一个估计的精度更好？为什么？答：95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时，置信区间由窄变宽，估计的精度下降。 5. 满足什么条件时可以采取正态近似法估计总体概率的置信区间？答：当n足够大，且样本频率p和1—p均不太小时，如np与n(1—p)均大于5时，可用正态近似法

18、求总体概率的置信区间。 6. 参考值范围与置信区间有何区别？答：区别：（1）意义不同：参考值范围是指通知总体中包括一定数量（如95%或99%）个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。（2）计算方法不同。第七章假设检验基础一，名词解释 1. 假设检验：是用来判断样本与样本，样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。统计推断：是在概率论的基础上依据样本的有关数据和信息，对未知总体的质量特性参数，做出合理的判断和估计。 2. 检验效能：当所研究的总体与H0确有差别时，按检验水平α能够发现它（拒绝H0）的概率。 3. 变量变换：

19、对资料数据进行数学变换，使得变换后的资料符合参数方法条件的一种方法。 4. Ⅰ型错误：如果实际情况与H0一致，仅仅由于抽样的原因，使得统计量的观察值落到拒绝域，拒绝原本正确的H0，导致推断结论错误，称为Ⅰ型错误。 5. Ⅱ型错误：如果实际情况与H0不一致，仅仅由于抽样的原因，使得统计量的观察值落到接受域，不能拒绝原本错误的H0，导致推断结论错误，称为Ⅱ型错误。二，问答题 1. 假设检验的理论依据是什么？（或者问基本思想）答：采用逻辑上的反证法，利用“小概率思想”。小概率思想是是指概率事件（p<0.05或p<0.01）在一次试验中基本上不会发生。反证法思想是先提出假设（检验假设H

20、0），再用适当的统计方法确定假设成立的可能性大小，如可能性小，则认为假设不成立；如可能性大，则还不能认为假设不成立。 2. 假设检验的一般步骤。答：（1）根据所讨论的实际问题建立原假设H0及备择假设H1；（2）选择合适的检验统计量，并明确其分布；（3）对预先给定的小概率α，由确定临界值；（4）由样本值具体计算统计量的观察值，并作出判断接受H0还是拒绝H0。 3. 假设检验的两类错误之间的区别与联系是什么？答：假设检验时，拒绝实际上成立的H0，犯第Ⅰ类错误，俗称“弃真”错误；不拒绝实际上并不成立的H0，范第Ⅱ类错误，俗称“存伪”错误。犯第Ⅰ类错误错误的概率用α表示，假设检验时，根据研

21、究者的要求来确定；犯第二类错误的概率用β表示，它只有与特定的H1结合起来才有意义。对于某一具体的检验来说，当样本含量n一定时，α越小，β越大；α越大，β越小。 4. 检验假设中P值的意义是什么？答：如果总体状况与H0一致，统计量获得现有数值以及更不利于H0的数值的概率。 5. 如何确定检验水准？答：检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。 6. 如何恰当地应用单侧与双侧检验？答：单侧与双侧检验的应用首先应考虑所要解决问题的目的，根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时，可用单侧检验；在尚不

22、能从专业知识判断两种结果谁高谁低时，则用双侧检验。一般认为双侧检验较保守和稳妥。 7. t检验的应用条件是什么？答：（1）随机事件，（2）来自正态分布总体，（3）均数比较时，要求两总体方差相等。第八章方差分析一，名词解释 1. 方差分析：又称F检验，是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同，用于比较两个或两个以上均数的差别。 2. 析因分析：是将两个或多个实验因素的各水平进行全面组合的实验，能够分析各实验因素的单独效应、主效应和因素间的交相呼应。二，问答题 1. 方差分析的基本思想是什么？答：方差分析的基本思想是把全部观察值间的变异按设计和

23、需要分解成两个或多个组成部分，然后将各个部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义。 2. 方差分析的应用条件是什么？答：（1）各样本是相互独立的随机样本，（2）都采自正态总体，（3）各个总体方差相等。第九章卡方检验 1. 卡方检验的应用条件有哪些？答：课本P174小结3 2. 卡方检验的用途。答：χ2检验常用于分类变量资料的统计阶段。主要包括单样本的拟合优度检验；推断两个和多个独立样本频率分布之间有无差别；分析配对设计下得到的两个样本频率分布有无差异。 3. 比较两个独立样本频率分布的χ2检验，和比较两个配对样本频率分布的χ2检验在设计方法

24、资料整理、假设检验等方面的差别是什么？答：前面针对的是“两独立样本”，行合计是事先固定的；而后者实质上是一组样本，及时可以看成两个样本，也是“两个互不独立的样本”，样本含量都是n，是固定的，而行合计与列合计却是事先不确定的。前者原始数据可以表示为教材中表9-3所示的四格表形式，而后者原始数据表示为表9-9所示的四格表形式。检验统计量，前者用教材中公式9-5和公式9-7，而后者用9-9和9-10。 4. 如果实验效应应用等级资料表示，欲比较两组总体效应间差别是否有统计学意义，为什么不能用χ2检验？请举例说明。答：关键在于此时χ2检验差别有统计意义，只能推断两频率分布不同，而频率分

25、布不同不能说明两总体平均水平不同。第十章基于秩次的非参数检验一，名词解释 1. 参数检验：凡是以特定的总体分布为前提，对未知的总体参数做推断的假设检验方法。 2. 非参数检验：非参数检验对总体分布不作严格限定，不受总体分布的限制，又称任意分布检验，它直接对总体分布作检验。二，问答题 1. 秩和检验有哪些优缺点？答：其主要的优点：（1）适用范围广：①等级资料。②偏态资料。当观察资料呈偏态或极度偏态分布而又未作变量交换，或虽经变量变换仍未达到正态或近似正态分布时，宜用非参数检验。③各组离散程度相差悬殊，即方差明显不齐，且不能通过变量变换达到齐性。④个体数据偏离过大，或资

26、料为单侧或双侧没有上限或下限。⑤分布类型不明。㈥初步分析。（有些医学资料由于统计工作量大，可采用非参数检验统计方法进行初步分析，挑选其中有意义者再进一步分析。）⑦对于一些特殊情况，如从几个总体所获得的数据，往往难以对其原有总体分布做出估计，在这种情况下可用非参数统计方法。（2）方法简便、易于理解和掌握。主要缺点：损失信息量，适用于参数检验条件的资料用非参数检验，检验效能降低。 2. 两组或多组有序分类资料的比较，为什么宜用秩和检验而不是χ2检验？答：指标为等级资料，宜用多组有序变量资料的秩和检验；若采用列联表χ2检验进行分析，其比较的就不再是实验效应，而是几组资料的间的分布有无差别，即比

27、较几类资料构成比总体上有无不同，所以不能用χ2检验。 3. 两独立样本比较的Wilcoxon秩和检验，当n1>10或n2—n1>10时用Z检验，这时检验是属于参数检验还是非参数检验，为什么？答：属于非参数检验，因为这时的Z检验是比较例数较小组秩和与其总体均数n(N+1)/2的差别。第十一章两变量关联性分析一，名词解释 1. 自变量：指实验中由于实验者所操纵的因素或条件。 2. 因变量：指实验中由于实验变量而引起的变化和结果。 3. 相关系数：又称Pearson积距相关系数，是定量描述两个变量间线性关系密切程度和相关方向的统计指标。 4. 线性相关：两个变量间呈现线性变化

28、趋势的关系称为线性相关。三，问答题 1. 线性相关中应注意的问题？答：（1）样本相关系数接近0并不意味着两变量间一定无相关性；（2）一个变量的数值人为选定时莫作相关；（3）出现异常值时慎用相关；（4）相关未必真存在内在联系；（5）分层资料盲目合并易出假象。 2. Pearson积距相关与Spearman等级相关有何异同？答：Pearson积距相关与Spearman等级相关的应用条件不同，前者要求数据服从二元正态分布，属于参数方法；而后者可不满足正态分布条件，为非参数法；相同点都是用来解决两变量间的线性相关程度的大小，相关系数的含义、单位、取值范围一致，且计算公式相同，不过一个

29、直接用原始的定量数据，另一个则要用等级数据。 3. 比较分类变量的两个样本或多个样本的频数分布所采用的χ2检验与关联性分析的χ2检验有何异同？答：分类变量的两样本与多个样本频数分布比较的χ2检验是对两样本或多个样本比较，而关联性分析的χ2检验却是探讨一份样本的两种属性所对应的两个变量间的关系，研究的问题不同、设计不同、检验假设不同、意义不同、结论不同；相同的仅是计算统计量的工具。 4. 分类变量配对的2×2资料在什么情况下用McNemerχ2检验，什么情况下用Pearson χ2检验？答：分类变量配对设计的2×2频数资料若是作两组频数比较，则用McNemerχ2检验，若是作两变

30、量间关联性分析则用Pearson χ2检验？课后习题案例讨论参考答案案例11-1 Pearson积距相关在对两变量间的相关性分析的实际问题中有广泛的应用，但在多数情况下，应用者忽视了Pearson积距相关的应用条件，把不是正态分布的变量间的关系也作Pearson积距相关，例如这里的饮水中的氟含量是定量资料，是否正态分布权且不论，但骨关节炎的患病率是属二项分布的分类资料，这显然不符合Pearson积距相关的条件，这份资料实际上该作Spearman等级相关。当然，若作者采集数据时有临床的检测指标，，如有关判断是否为骨关节炎的血象指标、某种炎症因子的含量等，那么可采用Pearson积距相关

31、的办法来确定饮水中的氟含量与检测人群的血象指标或某种炎症因子的含量间有无线性关系是可以的，但现在的数据是饮水中的氟含量与骨关节炎的患病率，对这两个变量就不能用Pearson积距相关，应该采用Spearman等级相关分析。案例11-2 用三种药物分别治疗慢性支气管炎患者实际上是三组独立样本的比较，据次不能考察关联性和计算关联系数。案例11-3 年龄和疗效都是有序变量，应当采用Spearman等级相关系数，而不应采用Pearson列联系数。案例11-4 首先从研究设计阶段，研究者应明确研究目的是为了考察两变量之间线性相关还是一般意义上便哦先为非独立的关联性，若收集到原始计量资料并

32、欲考察其线性相关，应首先绘制散点图以判断二者是否服从二元正态分布来决定采用Pearson相关还是Spearman相关（本例数据使用非参数相关为妥），将计量资料转化为二分类数据通常会损失信息量，而且本例中若得到分类数据进行χ2检验来判断两变量是否独立，在研究设计阶段最好事先明确变量分类的专业依据（如结果解释时临床医生所关心的病程低于多少年为短期患者，体重指数超过多少视为肥胖）直接得到分类变量，利用算数均数作为转换为二分类数据的分界点未必合适，χ2检验得到的关联性未必表示线性相关。第十二章简单回归分析一，名词解释 1. 线性回归：是利用数理统计中的回归分析，来确定两种或两种以上变量

33、间相互依赖的定量关系的一种统计分析方法之一。 2. 回归系数：回归平方和与总离均差平方和之比称为决定系数。二，问答题 1. Ⅰ型回归和Ⅱ型回归的区别与联系？答：前者要求Y为随机变量，服从正态分布，X可人为取值；后者X,Y均为随机变量，均服从正态分布。 2. 置信带的意义是什么？答：在满足线性回归的假设条件下，可以认为真实的回归直线落在两条弧形曲线所形成的区带内，其置信度为1—α。 3. 线性回归分析中应该注意哪些问题？答：（1）作简单线性回归分析要有实际意义，不要把豪无关联的两种现象强加在一起作回归分析。在理论上，任何成对的两组数据都可以获得一

34、个唯一的线性回归方程，并有可能作回归系数的假设检验有统计学意义。（2）在作线性回归分析前，一定要绘制散点图，观察全部数据点的分布趋势，只有存在线性趋势时，才可以进行线性回归分析。（3）线性回归方程的适用范围一般以自变量的取值范围为限，若无充分理由证明超过自变量取值范围仍是直线，应该避免外延。（4）作线性回归分析有统计学意义不等于有实际意义，考察线性回归方程的实际效果用决定系数R2的大小，而不是线性回归分析的假设检验的概率P值。 4. 简述线性相关与线性回归的区别与联系？答：联系：①r（相关系数）与b（回归系数）可相互换算；②r与b的假设检验等价；③r与b正负号一致；④回归可解释相

35、关，相关系数的平方r（对称决定系数）是回归平方与总的离均差平方和之比，故回归平方和是引入相关变量后总平方和减少的部分tr=tb=。区别：①资料要求上相关X，Y正态分布，回归Y正态分布；②应用上：相关说明相关关系，回归说明依存关系。③意义上：r说明两变量关系程度与方向b表示x增或改变，使Y改变b个单位；㈣计算上：b=Lαy/Lαx, r=Lxy/；⑤取值范围：-∞＜b＜＋∞，-1≤r≤1；⑥单位：b有单位，r无单位。第十三章多重线性回归与相关 1. 决定系数：回归平方和在总平方和总所占的百分比称为决定系数或确定系数。 2. 复相关系数：决定系数的平方跟。第十四章实验设计

36、一，名词解释 1. 处理因素：研究者根据研究目的而施加的特定的实验措施，又称受试因素。 2. 实验效应：处理因素作用于受试对象长生的反应或结局。 3. 完全随机设计： 4：配对设计：5.交叉设计：6：随机区组设计，7：析因设计案例讨论参考答案案例14-1 （1）该研究未设立对照，A、B两组并不是通过随机化得到的具有可比性的两个处理组，二十研究者根据病情所确立的，并欲惊醒疗效比较的两个组。（2）从文中可以看出，作者的目的是看三药联合作用治疗难治性心力衰竭的疗效如何，并比较对于不同血压、心衰患者的有效率。对于A、B两组，均未设立相应的对照组并作假设检验，仅凭两组有效率的点估

37、计值的大小就下结论”联合治疗难治性心力衰竭有良好的效果”是不科学的。案例14-2 （1）该研究的分组方式不是随机化分组，而是依照病例进入研究的顺序，及人为规定的前2位患者为治疗组（即试验组）病例，后1位为对照组病例。这样的分组方式带有很大的随意性，而不是随机。（2）该研究不能实现双盲。首先，分组方式即为研究者人为规定的顺序；其次，两组所用药物的外观有极大差异，所以对于试验的分组情况，研究者和受试者都不可能处于盲态。案例14-3 （1）有对照，属于实验对照；（2）试验组和对照组的设置不妥，两组没有可比性。试验组与对照组均给于了西药常规治疗，而该治疗是根据不同的病情选用不同的药物，这就可能

38、造成试验组与对照组患者接受的西药治疗不一样。对于两组治愈率上的差异，也就难以说明是两组患者接受的西药治疗的差异造成的，还是中药的疗效所致。案例14-4 （1）有对照，属标准对照。（2）该结论不妥。本案例属于诊断性试验，由于入选的受试对象为金标准确诊为阳性的病例，而不包括阴性病例，这样的设计不能看出实验方法与标准方法诊断的符合程度。正确的做法是，对同一批受试对象，用金标准和实验方法分别进行检查，然后对数据进行假设检验，然后得出结论。案例14-5 （1）最小理论频数为5.5>5，n=200>40，故选用一般χ2检验是合适的。经计算χ2=0.87，P>0.05，这才能得出二者差异无统计学意义

39、的结论，而研究者在文中所标注的P<0.05与“无显著性差异”的结论是相矛盾的。（2）该研究“二者临床疗效相似”的结论是缺乏科学依据的。因为一般的χ2检验属于差异性检验，只能回答疗效是否不同，而不是相同的问题，如果要解决相同或相似的问题，应该采用等效性检验。案例14-6 （1）该研究无论A组还是B组均接受了两种不同的处理，因此采用的设计方案为交叉设计。（2）该研究的统计分析方法不正确。研究的设计方案不同，相应的统计分析方法也不一样。该研究属于交叉设计，应该使用交叉设计的方差分析进行统计。课后习题答案 1. 答：实验研究和调查研究的根本目的在于研究者是否人为地设置处理因素，即是否对研

40、究对象施加了干预措施。试验研究中研究者可以主动施加干预措施，控制非试验因素的干扰，而调查研究则知识客观地放映事物的实际情况，未给予任何的干预措施。 2. 实验设计的三个基本原则是：对照，随机化，重复。 3. 使用安慰剂的目的在于消除受试对象和试验观察者由于主观因素造成的偏倚，以及对试验结果的人为干扰，保证试验的可靠性。一般在临床双盲试验中使用。 4. 随机化使非处理因素在实验组和对照组中的影响相当，因此提高了对比组间的可比性，使试验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。 5. 实验设计的基本要素有哦：受试对象、处理因素和实验效应。 6. 实验设计样

41、本含量估计的四要素是：欲比较的两总体参数的差值δ、有关总体变异的信息、第Ⅰ类错误概率的大小α以及第Ⅱ类错误概率的大小β或检验功效1—β。 7. 配对设计按可能影响结果的主要混杂因素将受试对象一一组成对子，然后随机分配到实验组和对照组。因此能够保证对比组间具有更高的可比性，与完全随机设计相比提高了检验功效，节约了样本含量。 8. 为避免医生和患者主观因素对实验效应观察造成的影响，应采用盲法、安慰剂和模拟技术，使医生和患者都不清楚处理措施的分配，以真正显示出处理因素的效应。 9. 此为自身对照。 10. 此为标准对照。 11. （1）配对设计；计数资料；可用配对设计χ2检验的校

42、正公式进行假设检验。思考题 1. 析因设计是一种多因素多水平交叉分组的全面实验设计方案，它是将两个或多个处理因素的水平进行组合，对所有肯呢个的组合都进行实验，从而探讨各处理因素各水平的差异，同时检验各因素间的交互作用。析因设计的特点在于其全面性，可探讨各处理因素不同水平的效应，同时可获得各处理因素间的交互效应；通过比较各种组合的效应还能寻求最佳组合。但析因设计的工作量较大，设计和统计分析复杂，众多交互效应的解释困难。 2. 交叉设计是一种特殊的自身对照设计。其中2×2交叉设计首先是将同质个体随机分为两组，每组接受了两种处理。当然阶段数和处理数都可以扩展，成为多种处理多重交叉实验

43、交叉设计一般用于有自愈倾向或病程较长的疾病研究。交叉设计的优点：一是节约样本含量，二是能够控制个体差异和时间对处理因素的影响；三是在临床试验中同等地考虑了每个患者的利益。其缺点，一是处理时间不能太长，二是当受试对象的状态发生根本变化时，后一阶段的处理将无法进行；三是受试对象一旦在某一阶段退出试验，就会造成数据缺失。 3. 本试验的目的为研究乌司他丁与奥曲肽联合治疗急性胰腺炎的效果，确定两药是否具有交互作用，最好采用2×2析因设计。应设立的4个组；空白对照组、乌司他丁组、奥曲肽组、乌司他丁+奥曲肽组。这样的设计既可以分别反映出乌司他丁与奥曲肽的效应，还能反映出两者的交互作用，为临

44、床用药提供参考。 4. （1）可采用完全随机设计。（2）应选择实验对照，即试验组食用维生素A强化食用油，对照组食用普通食用油。（3）观察指标应选择灵敏、客观的免疫功能指标，比如IgG，IgA，IgM，C3等。（4）需要观察控制的混杂因素如年龄，性别，疾病，家庭状况等，以及一些主观因素对试验结果的影响。为控制这些因素，在设计时，应明确纳入、排出标准，采用分层抽样方法进行抽样，自始至终贯彻随机化原则，同时该试验可使用盲法观察。 5. 本实验设计属2×2析因设计，因为在常用的设计方法中，析因设计能比较组间的效应和交互效应。如果研究目的仅在于次比较化疗和热疗对小鼠S18肿瘤模型的治疗效果是

45、否有差异，采用完全随机设计，或者随机区组设计，可不设热疗+化疗组。第十五章调查设计一，名解略（简单随机抽样，分层抽样，整群抽样，系统抽样名词解释）二，问答题 1。它们是两种主要的研究方法，其方法步骤基本相同。主要区别在于调查研究不能人为设置处理因素，也难以进行完全随机化，而实验研究则可以。二者可以结合使用，可起到取长补短的作用。 2. 调查研究主要有普查、抽样调查、典型调查等，每类还可以细分为多种方法。普查能得到全面的信息，但是费时费力；抽样调查能尽快得到结果，省时省力，但存在抽样误差；典型调查能突出代表性并尽快得到结果，但不能进行统计推断。 3. 对于无限总体只

46、能采取抽样调查，对于有限总体常常没有足够人力、物力、财力，也没有必要进行全面调查。因此，大多数的调查研究是抽样调查研究。四种概率抽样方法的比较叫教材的表15-3. 4. 在定性调查中，需要快速得到结果时最适合用小组调查法，如需要快速地知道人们对某些问题的观点和看法，或者需要征询大家的意见、集思广益迅速解决某个问题。 5. 参照调查设计的内容进行设计。注意应设计一定时间后的前后对比；调查表中应包括反映健康状况的项目（如慢性疾患患病率、传染病发病率）甚至生存质量等。 6. 首先进行病例-对照研究，筛选出可疑危险因素，再进行队列研究，进一步确认。 7. 从容易租住实施的角度看，最好采

47、取整群抽样调查法。可按“行政村”为群，随机抽取一些行政村，直到已婚育龄妇女总数超过3000人为止。但应适当放宽，因为实际的整群抽样调查中，不可能全部调查对象都能调查到。 8. 可按职业、经济状况等作分层抽样调查，也可按社区进行整群抽样调查，条件允许也可作简单随机抽样调查。 9. 先按年级分为6个层次，每个层次中按简单随机抽样的方法抽出2个班，对抽到的班的学生全部进行调查。 10. 可按年级或专业进行分层，在各层中用整群抽样的方法抽取1~2个班进行调查，或用单纯随机抽样、系统抽样在各层中抽取所需学生。 11. 这应该是一个前瞻性调查，在新型农村合作医疗实施前后进行多次调查以了解其

48、对卫生服务利用的影响。调查可采用整群抽样的方法，按经济发展水平分层抽取2~3个乡镇，每个乡镇再抽取几个整群“自然村”，对抽到自然村的全部农民家庭进行有关卫生服务利用的问卷调查，调查内容应该包括门诊和住院的次数，地点，费用等。 12. 本调查的对象应该是对该医院的服务质量有所了解的人群，可以对到过该医院就诊或住院的人群进行调查。首先需要设计一个过滤问卷，用于从该地居民中筛选出调查对象，然后视情况可进行普查或单纯随机抽样调查或系统抽样调查。 13. 流动人口一般属于无限总体，所以不能进行概率抽样，可以采取非概率抽样的方法，对一定数量的流动人口进行调查，如目的抽样或滚雪球抽样。但要注意的是这样抽取的样本不能代表总体的情况，因此调查的结果不能用于总体参数的估计。调查表的考评一般从效度，信度，可接受性等方面进行。理解信度，效度 7

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？