收藏 分销(赏)

卫生统计学知识点汇总.doc

上传人:丰**** 文档编号:10359007 上传时间:2025-05-24 格式:DOC 页数:11 大小:122.05KB
下载 相关 举报
卫生统计学知识点汇总.doc_第1页
第1页 / 共11页
卫生统计学知识点汇总.doc_第2页
第2页 / 共11页
点击查看更多>>
资源描述
1、 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题和解决问题的重要工具。 2、 统计工作的基本步骤:①设计;②收集资料;③整理资料;④分析资料 3、 分析资料是根据研究目的计算有关指标描述数据的基本特征,选择适当统计方法对资料进行分析,阐明事物的内在联系和规律的过程。统计分析包括: ①统计描述:是指选用统计指标、统计表或统计图等对资料的数量特征及其分布规律进 行测定和描述 ②统计推断:是指选择恰当的统计方法由已知的样本信息推断总体的特征,包括参数估计和假设检验 4、 (1)①同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同 质,或具有同质性 ②变异:我们将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异 (2)①总体:根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种特征或属性的观察值或测量值的集合。若总体明确了特定的时间和空间范围且包含有限个观察单位,称为有限总体。若总体没有特定的时间和空间范围的限制,且包含的观察单位个数是无限的或几乎是不可能准确计数的,称该总体为无限总体 ②样本:从总体中随机抽取的具有代表性的部分观察单位的集合 (3)①参数:反映总体特征的指标称为参数 ②统计量:根据样本观察值计算出来的指标称为统计量 (4)①变量:确定总体之后,研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。变量的观察值或测量值称为变量值或观察值 ②资料:变量值的集合称为资料。资料可分为定量资料(又称计量资料)和定性资料(又称分类资料)两类。定性资料又可分为计数资料和等级资料 (5)①抽样研究:从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究 ②抽样误差:由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差 产生抽样误差的根源在于个体变异,由于个体变异是普遍存在的,因此在抽 样研究中抽样误差是不可避免的,但它具有一定的规律性,可以用统计学方 法估计其大小 (6)概率:随机事件发生可能性大小的数值度量 当某事件发生的概率P≤0.05时,统计学中习惯上称该事件为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。 5、 医学研究方法主要有调查研究、实验研究和文献研究。 6、 调查研究又称为观察性研究,具有以下特点:①不能人为施加干预措施;②不能随机分 组;③很难控制干扰因素;④一般不能下因果结论 7、 调查研究的类型:根据抽样比例可划分为全面调查以及抽样调查;根据调查时间可分为 横断面(现况)调查、病例对照研究、队列研究及回顾性队列研究;根据抽样概率可划分为概率抽样调查及非概率抽样调查 8、 常用的抽样方法: ①单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统 计软件或抽签等方法之一的随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本 ②系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等 距分隔成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依次用相等间隔m机械在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本 ③分层抽样:先按时对观察指标影响较大的某项或某几项特征,将总体分成若干层, 该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本 ④整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组成,随机抽取一部分群,调查抽中群的全部次级观察单位 ⑤多阶段抽样:单纯随机抽样、系统抽样、分层抽样、整群抽样是四种基本的常用抽样方法,它们的抽样误差由小到大依次为:分层抽样,系统抽样,单纯随机抽样,整群抽样。但它们各有优缺点,在实际中尤其在较大规模的抽样调查中,常常是将四种基本的常用抽样方法综合运用于多阶段抽样中 9、 调查设计包括:调查准备阶段的设计、调查实施阶段的设计和调查总结阶段的设计三个 基本步骤 10、调查准备阶段的六项基本内容:明确调查目的和指标、确定调查对象和观察单位、选择 调查方法与技术、估计样本大小、编制调查表、评价问卷的信度和效度 11、调查实施阶段的设计(资料收集计划)包括:制订调查人员培训方案、确定资料的收集 方式等基本内容 12、调查总结阶段的设计(资料的整理与分析计划)包括:问卷的接受与核查计划、调查资料的计算机录入计划、资料的分组计划、统计分析计划 13、任何一项调查研究,首先应明确调查目的,这是各个环节中最核心的问题。从调查研究 的设计分析角度来说,目的主要有三个:①了解参数(总体的指标),②比较事物,用 以优化方案或探索影响因素,③研究变量之间的关系,用于预测或控制 14、调查目的必须具体化到指标,调查目的是选定调查指标的依据。对指标有如下要求:具体、精选、客观、精确性高、特异度和灵敏度高 15、问卷的提问原则:①简单明了;②避免混淆和模糊词语;③避免模棱两可或可能误解的问题;④避免诱导或强制 16、信度即测量工具的可靠性,它是指采用相同测量工具(如问卷)对同一对象进行重复测 量时,各次测量值与其均值接近的程度。换言之,信度是指测量结果的一致性或稳定性, 即测量结果能否稳定地测量所测的事物或变量。信度指标通常用信度系数来评价,常用的信度指标有重复测量信度、复本测量信度、折半测量信度、内部连续性测量信度 17、效度是指测量工具、指标或观测结果在多大程度上反映了事物的客观真实性,即指观测结果与试图达到的目标之间的接近程度,是对测量工具(如问卷)有效性的检验 18、调查资料的收集方式:直接检测、访谈、电话调查、信访、集中调查法 19、资料的整理与分析步骤:问卷的接受与核查、数据的计算机录入、资料的分组、统计学分析、医学专业分析 20、随机化原则是统计学的分析基础,盲法是克服测量偏倚的有效手段 21、实验研究是指研究者根据研究目的人为地对受试对象(包括人或动物)施加处理因素, 控制混杂因素,观察、总结处理因素效应的一种研究方法 22、实验设计是对实验研究所做的周密计划,包括实验研究的资料搜集、整理、分析全过程的设想和安排。通常将满足条件的实验对象随机分配到两组或多组中去,观察比较不同处理因素的效应或结果 23、实验设计的特点:①研究者能人为设置处理因素 ②受试对象接受何种处理因素或水平是由随机分配而定的 24、实验设计的基本要素:处理因素、受试对象、实验效应 25、处理因素是指研究者施加于受试对象的因素(如某种药物、某种手术等),而有时受试者本身的某些特征也可成为处理因素,如性别、年龄、职业、文化程度、民族、婚姻状况等 26、混杂因素是指影响实验效应并与处理因素同时存在的非处理因素 27、水平是指同一处理因素在数量上或强度上的不同程度 28、处置处理因素要注意:①抓住实验中的主要因素 ②确定处理因素和非处理因素 ③处理因素标准化 29、控制混杂因素影响的方法:排除法、平衡法、标准化法 30、受试对象是处理因素作用的客体或对象。一般选择受试对象的原则是:①受试对象能从临床试验中受益,②受试对象具有代表性,③受试对象具有依从性,④受试对象可以是志愿者 31、指标的选择应考虑指标的客观性、灵敏度和精确性。 其中精确性包括准确度和精密度。准确度是指观察值与真值的接近程度,说明观察有无系统误差。精密度是指重复测量或观察时,观察值与其平均值的接近程度,说明随机误差的大小 32、观察时最好采用盲法,避免产生偏性 33、实验设计的基本原则:对照原则、随机原则、重复原则、均衡原则 34、对照是指除了试验组外,再设置一个或多个对照组进行同步试验,以比较试验组的效应情况。其意义在于使处理因素和非处理因素的差异有一个科学对比,鉴别处理因素与非处理因素之间的效应差异,消除或减少实验误差 35、对照的形式: ①空白对照:对照组不接受任何处理因素 ②安慰剂对照:采用一种无药理作用的假药作为对照。目的是显现出药物的真实效应,消除心理作用等因素的影响 ③标准对照:用现有的标准疗法或药物作为对照 ④实验对照:对照组不施加处理因素,但施加某种与处理因素有关的实验因素 ⑤自身对照:也称为自身交叉对照。实验与对照在同一受试对象身上进行,其应用受一 定条件的限制,结论的推导应慎重 ⑥历史对照:用过去的研究结果作为对照 ⑦相互对照:几种实验组互为对照,比较几种处理因素的实验效应的强弱 36、设立对照时的常见错误:无对照、对照不足、对照多余 37、随机化的作用是使样本具有较好的代表性,使各组受试对象在重要的非处理因素方面具 有较好的均衡性,提高实验结果的可行性。 38、随机化包括随机抽样和随机分组 ①随机抽样:指保证总体中的每一个个体都有同等的机会被抽出来作为样本 ②随机分组:指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组 一般用随机数字表、随机排列或统计软件包来实现随机抽样和随机分组 39、临床研究中常用的随机分配方法: ①简单随机化:可通过抛掷硬币、抽签、摸球、查随机数字表或应用计算机软件产生的随机数字来表现 ②区间随机化:根据受试者进入研究的时间先后顺序,将其分成含有相等列数的若干区组,而后,区组内的受试者被随机分配到不同的处理组 40、重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本列数 41、均衡原则又称齐同对比原则,指试验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。试验组和对照组的非处理因素不均衡,将导致错误的实验结果。其作用是使受试对象受到的非处理因素的影响完全平衡,使所研究的处理因素的真实效应显现出来 42、实验设计的基本步骤:①明确实验目的;②确定研究对象;③确定可比的实验组和对照组;④确定把受试对象分配到各处理组中的原则;⑤确定样本含量;⑥确定方法和指标;⑦偏倚及其控制 43、选择偏倚是指在研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对 象之间存在系统差异,由此造成的偏倚称为选择偏倚。选择偏倚主要表现在描述性和分 析性研究中: ①描述性研究的选择偏倚主要表现在样本的代表性上,如果没有遵循随机化原则进行抽样,而是使用某些特定人群志愿者、健康人(临床试验)等 控制方法主要是遵循随机化原则,采用随机抽样,避免样本选择偏倚,对特定群体的研究结果一般不要任意外推 ②分析性研究的选择性偏倚主要表现在研究对象进入、排除、失访或不参与(研究对象不同意)等于处理因素存在关联,由此增大或减少处理与效应的关联,导致效应估计的偏倚。 确定有无选择偏倚的关键,在于把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度 控制选择偏倚的方法主要是严格制定入选标准、排除标准,遵循随机化原则,注意选取 对象的代表性,减少脱落或失访等 44、信息偏倚又称测量偏倚或观察偏倚,是在收集资料(测量或调查)过程中由于方法不当或其他原因所引起的系统误差。在疾病分类测量中产生的信息偏倚可称为错分偏倚。信息偏倚同样影响着描述性研究和分析性研究的结果 控制方法是严格制定测量或信息收集方法以及疾病分类的标准,对于测量人员或调查人员应该统一培训,掌握测量和调查技巧与方法,尽可能采用盲法收集资料,尽量采用客观指标或记录,以及利用其他来源的信息加以核查,减少或避免信息偏倚 45、混杂偏倚是指暴露因素与疾病发生的相关(关联)程度受到混杂因素的歪曲或干扰所产生的偏倚 在设计阶段通过配比、随机化分配或限制进入(选择混杂因素的某个层的对象)等方法来控制。在统计分析阶段可采用标准化率分析、分层分析和多变量分析等来控制 46、常用的实验设计方案:完全随机设计、配对设计、随机区组设计、交叉设计、析因设计、重复测量设计 实验设计方案 概念 应用范围 优点 缺点 完全随机设计 又称为随机对照实验,属于单因素研究设计,是将受试对象按照随机分配的原则分配到实验组和对照组中,然后给予不同的处理因素,对各组的效应进行同期平行观察,最后比较各组的观察指标有无差别 在只有一个研究因素时,如果不需要进行配伍或者无法配伍的时候就选用完全随机设计,在动物实验和临床疗效观察研究中均可采用。通常是在非实验性因素对效应指标影响不是很大的情况,或非实验性因素对效应指标的影响在实验组和对照组均衡的情况下采用这种设计方案 实验设计和统计分析简单 一次只能研究一个因素,且所需样本含量较大 配对设计 将受试对象按照一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组 ①自身对照设计:比较受试者实验前后的变量值改变情况,或比较同一标本接受两种不同测定方法的检查结果。主要适合于急性和短期的试验,或观察病情稳定的慢性病短期对症治疗的效果。对于实验时间较长的试验通常不用该方法,因为时间长,其他混杂因素渗入的可能性就大,对试验结果造成影响,使得试验前后失去可比性;②异体配对设计:将受试者按照一定的条件,将条件相同的个体配成对子即一一配对,在对子内按照随机方法,将一个分配到试验组,另一个分配到对照组,进行实验观察。可用于急性试验或慢性试验的研究。特别是在动物性试验研究中,异体配对容易实施,通常将动物的种属、品系、性别、体重、窝别、生长天数作为配对的基本条件 提高组间均衡性,减少实验误差,提高统计效率 太多的配对条件容易造成配对的困难 随机区组设计 将几个条件相同的受试对象配成一个区组,再将区组中的受试对象采用随机的方法,分配到不同的处理组中,以增强各处理组的均衡性 随机区组设计是医学研究中常用的一种设计方案,广泛应用于动物实验或临床试验研究中,对于两种处理因素,每个处理因素有两个或两个以上水平的研究可采用随机区组设计的方法 随机区组设计属于两因素设计,可分析处理因素(因素Ⅰ)间或区组(因素Ⅱ)间的实验效应有无差别。组间的均衡性好,抽样误差小,实验效率高 当实验动物偶然死亡则实验结果一般需改用完全随机设计方法处理 交叉设计 一种特殊的自身对照设计,它按事先设计好的试验次序,在各个时期对研究对象先后实施各种处理,以比较各处理组间的差异 交叉设计适用于病程较长的慢性疾病,不适用于病程较短的急性疾病,因为大多数急性病的病程较短,一个疗程就已经治愈,不可能再执行第二阶段的交叉用药 ①节约样本含量;②能控制个体差异和时间对处理因素的影响,效率较高;③在临床试验中,每个受试对象同时接受处理因素和对照(如标准疗法或药物) ①每个处理时间不能太长;②当受试对象的状态发生根本改变时,如死亡、治愈等,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成该阶段及其以后的数据缺失,增加统计分析的难度 析因实验设计 又简称析因设计,它是一种多因素的交叉分组试验设计。它将两个或多个因素的各个水平进行排列组合,交叉分组进行试验,既研究各因素的主效应作用,又要研究各因素的交互作用 主要用于分析各因素间的交互作用,比较各因素不同水平的平均效应和因素间不同水平组合下的平均效应,寻找最佳组合 ①是一种高效率的设计方法,可观察多个因素的效应;②能够分析多种交互作用,以获得丰富的结论;③能直接表达分析结果 ①统计分析较复杂;②临床科研中不易获得适于分析交互作用的资料;③因素及水平数均不宜过多 重复测量设计 对同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料 常用来分析该观察指标在不同时间点上的变化特点 特点:①在m个不同的时间点上对同一对象的某个指标进行m次(m≥2)重复测量;②不同时间点重复测量值之间存在自相关性;③测定时间可以是等距的,也可以是不等距的;④有时部分受试对象在最后的若干时间点上可出现缺失数据;⑤观察指标可以是定量或定性的 47、重复测量设计与随机区组设计的区别: (1)重复测量设计中的“设计”是在区组(受试者)间随机分配,区组内的各个时间点是固定的,不能随机分配。随机区组设计要求每个区组内受试者彼此独立,处理只能在区组内随机分配,每个受试者接受的处理是不同 (2)重复测量设计区组内受试者彼此不独立。重复测量设计的数据用随机区组设计方差分析比较处理组间差异,前提条件是要求满足“球对称”假设 48、临床试验是以患者为研究对象的医学研究,通过对受试对象施加某些干预措施,如新药、 新疗法等,观察其对人体的作用、不良反应等,以确定治疗措施或药物的效果与安全性 49、临床试验特点:①前瞻性研究;②以人为研究对象;③社会因素影响;④主观因素影响;⑤同一治疗方案 50、临床试验的基本原则:随机、对照、均衡、重复和盲法 51、所有以人为研究对象的研究必须符合《世界医学大会赫尔辛基宣言》,即公正、尊重人 格、力求使受试者最大程度受益和尽可能避免伤害 52、新药临床试验时,必须由指定的药物临床试验机构按照《药物临床试验质量管理规范》进行 53、医学伦理学是应用一般伦理学原理和道德原则研究医学领域内的人类行为的一门应用性 科学 54、医学伦理委员会职责为:①开展有关科研项目的伦理审查 ②指导人类辅助生殖技术工作 ③指导临床药理基地工作 ④医学伦理教育培训,咨询服务协调,指导对医学生的医学伦理教育工作 55、医学伦理学原则:①知情同意原则;②尊重原则;③有利原则;④公正原则;⑤保密原则 56、临床试验中常见的偏倚: 常见的偏倚 造成因素 控制方法 选择性 偏倚 (由于选择试验对象不当或分组不均衡等引起的) 入选偏倚 研究者对临床试验入选标准规定不太明确,或没有按入选标准而纳入了不合格的受试者,使两组的受试者不尽相同产生的偏倚 根据临床试验的目的,患者的年龄、病情程度、病程长短、临床症状、体征、生化检验等因素制定具体明确的入选标准。研究者严格按入选标准纳入受试者 排除偏倚 研究者对临床试验排除标准规定不太明确,或没有按排除标准而排除了合格的受试者,使两组的受试者排除不相同产生的偏倚 根据临床试验的目的,患者的年龄、妇女特殊生理期、病情程度、病程、合并症、过敏史、治疗史、鉴别诊断等制定统一的排除标准。研究者严格按排除标准核实排除受试者,减少或避免排除偏倚 分组不均衡性偏倚 研究者没有遵循随机分组原则或采用简单随机分组方法产生的偏倚 严格遵循随机化原则,或采用分层区组随机化方法 非同期对照偏倚 研究者没有设置同期对照组,或观察病例太多,观察时间很长而出现非同期对照,产生非同期对照偏倚 设置同期对照组,如果观察病例太多,应该多中心或多单位合作,同时观察,缩短观察时间 观察性 偏倚 (由于在临床资料的收集、整理过程中因各种原因的影响产生的) 调查偏倚 由于调查人员的素质不高或询问试验组与对照组的态度、方式不同,或两组的调查环境与条件不同产生的偏倚 试验组和对照组的环境与条件尽可能相同,统一培训调查人员,统一询问措词、态度、方式和技巧,盲法调查或观察 回忆偏倚 由于受试者记忆不完整,回忆情况与真实情况产生的偏倚 减少回忆内容,必须回忆时尽量提供有关文字、图片记录 无应答偏倚 在临床试验中,需要进行信访或电话询问时出现无应答现象,无应答者与有应答者产生了无应答偏倚 减少信访或电话询问,增加面对面的家访(如果患者不在家,可询问其亲属或邻居)。如果需要出院后信访或电话询问者,应多留几个亲属的联系地址或手机号码(或电话号码) 测量偏倚 测量偏倚又称试验条件偏倚,由于试验组和对照组的临床试验场所、条件、测定方法、测定仪器、测定试剂等不同,或研究者没有制定或执行标准操作规程,或研究者操作和判断水平不统一产生的偏倚 统一试验组和对照组的临床试验场所、条件、测定方法、测定仪器、测定试剂等,统一培训测试人员,固定测试人员,制定标准操作规程,严格执行标准操作规程,盲法测量 脱落偏倚 脱落偏倚包括失访偏倚、非依从性偏倚等,在临床试验中,由于患者出差、旅游或到亲戚家等或依从性差没有坚持治疗而出现自然脱落产生失访偏倚。依从性偏倚是因受试者发生不良反应事件、并发症或特殊的生理变化等不宜继续治疗而产生的偏倚 研究人员需要耐心、详细向患者介绍坚持治疗的重要性,树立战胜疾病的信心,自觉坚持治疗到疗程结束,如某些疾病在临床症状消失后还需要继续治疗一段时间,否则容易复发,复发后细菌或病毒因治疗不规范而容易产生耐药性等,或在估计样本例数基础上适当增加一些例数,以防止病例脱落。对于非依从性偏倚,应该在设计时尽量制定具体明确的纳入标准和排除标准,严格执行纳入标准和排除标准 混杂偏倚 临床试验中的混杂偏倚与前述相似,主要是由混杂因素引起的偏倚 将预期的重要混杂因素进行分层设计,临床试验中严格执行随机化方案,使一已知或潜在的混杂因素在各组分布均衡。在统计分析中将重要的混杂因素进行分层分析或作为协变量分析,以便减少混杂偏倚,提高统计检验效率 意向性分析偏倚 意向性分析是对所有经随机分组并坚持用药至疗程结束的部分或全部病例进行的初步分析,尤其是对疗效和不良事件进行分析。在进行意向性分析时,由于某些数据不全或缺失值处理不当等产生的偏倚称为意向性分析偏倚 对数据的录入、校对、修改、分析、缺失值处理、数量化、变量转换等制定统一的标准,采用同一统计软件包进行分析 57、表达变量取值及其不同取值频数分布情况的统计表称为频数分布表,简称频数表。频数表的用途:①揭示资料的频数分布特征和频数分布类型;②便于发现某些特大或特小的可疑值;③便于进一步计算指标和统计处理 58、频数分布图又称直方图,其用途与频数表相似,但在表达频数分布特征及分布类型时较频数表更直观、形象 59、定量资料的描述: 描述类型与指标 相关概念 应用 集中趋势的描述 算术均数 常简称均数,是用一组观察值相加除以观察值的个数所得。用于反映一组同质观察值的平均水平。常用表示样本均数,μ表示总体均数 适用于对称分布特别是正态分布资料集中趋势的描述,此时均数位于分布的中心,既表达了集中的位置,又表达了一组观察值数量上的平均水平 几何均数 用G表示,是n个观察值乘积的n次方根,又称倍数均数 (1)几何均数适用于:①对数对称分布(含对数正态分布),即数据经过对数变换后呈对称分布或正态分布的资料;②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。(2)计算几何均数时观察值中不能有0,因为0不能取对数;观察值也同时有正有负 中位数 用M表示,是将一组观察值由小到大排序后,居于中间位置的数值即为中位数。中位数是一种位置平均数,它将全部数据排列成的有序数列平均分为两部分,,在全部观察中,小于和大于中位数的观察值个数相等,各占一半(50%) 常用于描述偏态分布资料、一端或两端无确切数据的资料及总体分布不明资料的集中趋势 百分位数 用Px表示,是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数。百分位数是一种位置指标,一个百分位数Px将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)% 的观察值比它大。中位数也是一个百分位数,即第50百分位数,表示为P50.P25、P50、P75这三个百分位数将全部观察值等分成了四部分,通常又称之为四分位数,其中P25称为下四分位数,用QL表示,P75称为上四分位数,用QU表示 用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值得分布特征;百分位数还可用于确定非正态分布资料的医学参考范围。但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数 离散趋势的描述 极差 亦称全距,是一组同质观察值中最大值与最小值之差。极差大,反映了全部观察值所在范围的变异程度大,数据较为分散;反之,极差小,说明变异程度小,数据较为集中 由于其容易受极端值的影响,一般仅用于初步了解资料的变异程度 四分位数间距 为上四分位数QU(即P75)与下四分位数QL(即P25)之差。四分位间距可看成是中间50%观察值的极差,其数值越大,变异程度越大;反之,变异程度越小 常用于描述偏态分布以及分布的一端或两端无确切数值资料的离散程度 方差 是每个观察值离均差平方的“均数”。每个观察值的离均差平方就是各观察值与均数之间距离平方的数值。总体方差用σ2表示,样本方差用s2表示。相同指标,方差越大,说明数据围绕均数分布越分散,变异程度越大;反之,说明数据围绕均数分布越集中,变异程度越小 描述对称分布,特别是正态分布或近似正态分布资料离散程度的指标,反映了每个观察值相对于均数的离散程度 标准差 表示每个观察值与均数之间距离(绝对距离)的平均水平。总体标准差用σ表示,样本方差用s表示。标准差越大,说明数据围绕均数分布越分散,变异程度越大;反之,说明数据围绕均数分布越集中,变异程度越小 变异系数 是一组观察值的标准差与其均数的比值,是一种相对变异指标 常用于比较度量单位不同或单位相同但均数相差悬殊的两组或多组资料的变异程度 60、正态分布是一种非常重要的连续型随机变量的分布 61、正态分布的特征: (1)正态曲线:在横轴上方均数处最高,向两侧逐渐下降,并以均数为中心,左右对称,但两端与横轴永不相交,呈钟形曲线 (2)正态分布有两个参数,即均数μ和标准差σ:μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。 62、正态曲线下面积的分布有一定的规律: (1)正态曲线与横轴之间的面积恒等于1或100% (2)正态分布为对称分布,其对称两侧的面积各为50% (3)区间(μ-σ,μ+σ)的面积为68.27% ,在区间(μ-1.96σ,μ+1.96σ)的面积为95.00% , 在区间(μ-2.58σ,μ+2.58σ)的面积为99.00% 63、正态分布的应用: (1)估计正态分布或近似正态分布资料的频数分布 (2)制定医学参考值范围: (3)质量控制 (4)其他统计方法的理论基础 64、常用相对数及其应用: 常用相对数 概念 应用 计算相 对数时,分母不宜过小 率 说明某现象发生的频率或强度的指标 ①率在医疗卫生工作和科学研究的分析中应用十分广泛,如患病率、感染率、治愈率、病死率、死亡率等;②当率的分母无时间量纲时,率的分子是分母中的一部分,因而其值不会超过1;③计算几个率的合计率时,不能简单地将几个率求平均,而应分别将这些率的分子、分母相加,然后相除得到合计率;④几个率互相比较大小时应注意可比性 构成比 表示事物内部各组成部分所占的比重,常以百分数表示,因此也称为百分比 ①事物中某部分的构成比大,说明事物中以该部分的频数为多;②事物内部各构成比的总和等于100% ,且存在此消彼长的关系;③某一部分构成比的改变将影响其他构成比的变化 相对比 两个指标A、B之比 ①A、B可以是绝对数;②A、B可以是相对数;③A、B可以是性质相同的两个指标;④A、B的单位可以相同,也可以不同 65、动态数列及其应用: (1)一系列按时间顺序排列起来的统计指标称为动态数列 (2)动态数列的基本分析指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度 (3)定基发展速度与增长速度反映指标总的变动趋势,环比发展速度与增长速度反映指标的逐期变动情况 66、标准化法: (1)概念:标准化法是在一个指定的标准构成条件下进行率的对比的方法 (2)意义:当两个率要进行比较大小时,研究者应注意其是否具备可比性。若要对比的两组对象内部构成的差别足以影响结论时,可以应用率的标准化法消除这种影响,使两个率具备可比性 (3)基本思想:寻找一个统一的分布作为标准,各相互比较的组按该标准计算相应的率。所得到的率是根据同一标准计算的,或者说用同一标准对原来的率进行了调整,故称为标准化率或调整率。标准化率不能反映各组的实际水平或死亡水平等,只是相对于标准组的情况 67、标准化率的计算: 计算方法 适 用 情 况 使用要求 计算步骤 注意事项 直接法 适用于两组资料中,某事物发生率的互相对比 要求已知两组资料的内部构成以及相应的该事物的发生率 ①选取一个标准内部构成;②按所选取的标准内部构成计算两组资料的总数;③计算两组资料的标准化率 ①可以采用多种方法来选取标准人口数,不同的标准计算出的两个标准化率的值可能不同,但大小关系一般不会发生改变;②并非所有资料都有可以计算标准化率,当采用不同的人口标准得到不同的结论时不能计算标准化率 间接法 适用于将某特殊人群A与标准人群B比较 要求已知A人群的总人口数和总死亡数、A人群的年龄别人口数、B人群的年龄别死亡率和B人群的总死亡率 ①选取A人群死亡率作为标准;②计算按照A人群所在地的死亡率水平,A人群各个分组的预期死亡率;③求标准化死亡比SMR(=实际死亡人数/预期死亡人数);④求标准化率p'(=标准总死亡率×SMR) ①两个人口年龄构成不同的人群的间接法标准率一般不能相互比较;②间接法标准化率常用于将某个特殊人群与标准死亡率的人群进行比较 68、样本均数(或样本率)不能直接作为总体均数(或总体率)的估计,而应该考虑抽样误 差的存在,借助抽样分布对总体均数(或总体率)做出估计 69、标准差σ与标准误σ 有区别: ①标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小 ②标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验 70、σ 越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大, 由样本均数估计总体均数的可靠性越小;反之,σ 越小,样本均数的分布越集中,样 本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。 在实际工作中,可通过适当增加样本含量来减小抽样误差 71、t分布的特征: (1)t分布呈单峰分布,在t=0处最高,且以0为中心左右对称 (2)不同的自由度对应不同的t分布,t分布曲线是一簇曲线 (3)自由度ν越小,t值越分散,曲线越平阔,尾部越高;随着自由度ν的增大,t值越集中,曲线越尖峭,尾部越低 (4)当ν趋于∞时,t分布逼近标准正态分布(z分布),即t分布的极限分布为标准正态分布,或者说标准正态分布是t分布的特例 72、从t界值表可以看出: (1)自由度相同时,t界值越大其对应的P值越大,反之亦然。这一性质在假设检验中将有重要应用 (2)概率P(或尾部面积)相等时,ν越大,t界值越小 (3)t界值相等时,双侧概率为单侧概率的两倍 (4)ν=∞时,t界值即为z界值 73、将样本统计量直接作为总体参数的估计值就是点估计。点估计方法简单,但未考虑抽样误差的影响,估计的正确程度很难评价 74、区间估计即按照事先给定的概率(1-α),估计包含未知总体参数的一个可能范围,该 范围称为参数的可信区间或置信区间。(1-α)称为可信度或置信度,也可表示为100 (1-α)% ,常取95% (也可取90% ,99% )。可信区间通常由两个数值,即两个可信 限或置信限表示,较小者称为下限,较大者称为上限 75、总体均数的95%可信区间的含义:如果固定样本含量,从同一总体中随机抽取100份独立样本,每份样本分别计算1个可信区间,这100个可信区间中,将大约有95个可信区间包括总体均数,大约有5个可信区间不包括总体均数 76、随机变量X服从参数为n和п的二项分布,记为X~B(n,п)。二项分布是一种离散 型概率分布。参数n称为离散参数,只能取正整数;参数п是事件A发生的概率 77、Poisson分布是一种重要的离散型概率分布,用于描述在单位空间或时间内随机事件发生的次数。Poisson分布可以看做是发生概率п很小,而观察例数n很大的二项分布。 78、Poisson分布具有以下特征: (1)总体均数与总体方差相等,即μ=σ2。利用这一特征,可以初步判断一个离散随机变量是否服从Poisson分布 (2)若m个互相独立的随机变量X1,X2,…,Xm分别服从参数为μ1,μ2,…,μm的Poisson分布,则其和X1+X2+…+Xm也服从均数为μ1+μ2+…+μm的Poisson分布。应用中常利用Poisson分布的可加性,将若干个互相独立的小观察单位合并成一个大观察单位,从而使均数μ≥20,以便将服从Poisson分布的资料按正态近似处理 79、在抽样研究中,由于抽样误差的存在,由样本统计量之间的差别不能直接得出总体参数 之间的差别,要进行假设检验 80、假设检验的基本思想可归纳为:首先,假设某两个或多个总体参数相等、总体分布相同或总体服从某种分布(称为原假设);然后,假定该假设成立并计算相应的检验统计量;最后根据相应的分布确定P值,做出统计判断。若P值小于或等于预先规定的小概率水准α(如0.05),则获得现有样本统计量为小概率事件。而小概率事件在一次实验或观察中发生的可能性很小或很可能不发生,因此,如果它发生了,则有理由怀疑原假设不成立,进而拒绝原假设。若P值大于预先规定的小概率水准α,则尚无充分的理由拒绝原假设,因而不拒绝原假设。由此可见,假设检验主要运用了小概率事件原理和数学上“反证法”的思维 81、假设检验的基本步骤:①建立检验假设,确定检验水准 ②计算检验统计量 ③确定P值,做出推断结论 82、假设检验的两型错误: Ⅰ型错误:拒绝了实际上成立的H0,即“弃真”。其发生的最大概率为α Ⅱ型错误:接受了实际上不成立的H0,即“取伪”。其发生的概率为β 83、当P≤α而拒绝H0时,只可能犯Ⅰ型错误,不可能犯Ⅱ型错误 当P﹥而不拒绝H0时,只可能犯Ⅱ型错误,不可能犯Ⅰ型错误 84、1-β为检验效能或把握度,表示当两总体参数确有差别时,按α水准假设检验能发现这种差别的能力 85、对同一资料,α与β反向变化,若同时减小α与β,唯一的方法是增大样本含量,同时也以为着提高了检验效能。若重点减少Ⅰ型错误,α可取小一些;若重点减少Ⅱ型错误,α可取大一些 86、假设检验的效能主要受四个因素的影响:①两总体参数的真实差异 ②总体标准差σ ③Ⅰ型错误α ④样本含量n 87、当μ≠μ0时,为双侧检验;当μ﹤μ0或μ﹥μ0为双侧检验 88、单侧检验与双侧检验的区别:备择假设H1与确定P值查表时不同,若误用,单侧检验较容易犯Ⅰ型错误,双侧检验较容易犯Ⅱ型错误 89、单侧检验与双侧检验的联系:对同一份资料。凡双侧检验得P≤α,单侧检验必得P﹤α;凡单侧检验得P﹥α,双侧检验必得P﹥α 90、假设检验的前提条件是:总体应具有同质性,样本应具有代表性及组间可比性 91、有统计学意义并不等于有实际意义 92、假设检验的结论不能绝对化 93、假设检验与可信区间的区别: ①假设检验用于推断总体参数有无质的不通过,可信区间用于估计总体参数的大小 ②可信区间也可回答假设检验的问题,但不能提供确切的P值,只能给出在α水
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服