资源描述
样本、总体:1总体:根据研究目的确定的同性质的所有研究对象的某项或某几项指标测量值的几个。根据总体积和所包括元素是否有限分为有限总体、无限总体。具有特定的分布特征和参数。2样本:以某种方式按预先规定的概率从总体重随机抽取、足够数量、能代表总体分布特征的一部分观察单位某指标数据的集合。3关系:根据研究目的,从总体重抽取部分有代表性的样本,用样本统计量推断总体参数。
标准差、标准误:1差S:单个测量值对其均数x的离散程度。误Sx或Sp:样本统计量对总体参数的离散程度。2差越大误越大。3差描述观测值变异范围。误推断估计总体参数的可信区间和假设检验。4计算公式:
I型错误、II型错误:1假设检验无论接受或拒绝原假设均有可能犯错误。2,I:在假设检验中拒绝了一个实际成立的原假设所犯的错误,概率记α。II:~中接受实际不成立,β。3当样本含量确定时,α↑β↓,反之~。4增大样本含量αβ↓。
正态分布、二项分布:1正:连续型随机变量X常见而重要的分布。若X在实数范围内取值且具有其相应的概率密度、概率分布函数,则X服从正。记为X~N(μ,σ^2)。2二:离散型随机变量的分布。在n次Bemoulli试验中,结果A出现K次这一随机事件的分布,记为X~B(n,π)。概率计算公式为P(X=k)=n!/k!(n-k)!。
取值范围、可信区间(X±1.96S、X±t0.05/2,v Sx):1X:算术平均数,描述一个变量所有观察值的平均水平,适用于频数分布对称的数据。S:标准差,~所有观察值与均数的平均离散程度。Sx:标准误,反应样本均数间离散程度、与相应总体均数间差异,说明均熟抽样误差大小的指标,均数大小成正比,与样本含量n的平方根成反比。Sx=S/根号n。t0.05/2,v:自由度为v双侧尾部面积为0.05的t界值。2 X±1.96S:从正态总体中抽样样本含量较大时,观测值95%的波动范围。X±t0.05/2,v Sx:从~时,总体均数95%可信区间(置信区间)。
处理因素、混杂因素:1处:实验性因素。对受试对象机遇的某种主动是假或客观存在的外部干预或措施。2混:在实验研究中除了处~对实验结果产生影响外的一切非处~。这些因素有的可控有的不可控。3在同一实验研究中,处应相对固定统一标准,尽量控制避免非处。
计量资料、计数资料:1量:通过度量衡方法测量每一观察单位某项指标的量的大小而得到的一系列数据资料。多有度量衡单位、为连续性资料。2数:将全体观测单位按照某种性质或特征分组,然后在分别清点各组单位的个数而得到的数据资料。无度,多为间断性资料。
单侧检验、双侧检验:1备择假设H1:u1≠u2,u检验的检验水准取双侧概率a/2,u检验的检验界值定位ua/2(标准正态分布的右侧界值,ua/2>0),无论检验统计量u正负,只要∣uα/2∣>0,都拒绝H0接受H1,这种只检验差别不管差别方向的双向检验称为~。2备择假设H1:u1>u2,此时只关心u>0情况,u检验的检验水准取单侧概率a,u检验的检验界值定位ua(标准正态分布右侧界值,ua>0),若备择假设H1:u2<u1,此时只关心u<0的情况,u检验的检验界值定位-ua,这种只关心差别单侧方向的单向检验~。
Sb、Sy.x:1Sb=Sy.x/根号下Σ(x-x)^2,回归系数标准误。2Sy.x=根号下(Σ(y-y)^2/(n-2))=根号下(SS剩/(n-2)),表示y的剩余标准差,即扣除x对y的线性影响后y对回归线的离散成都,度量了实际散点远离回归直线的离散成都,反映了模型的可靠性,越小模型越好。
调查研究、实验研究:1实:研究者主动安排实验因素、控制实验条件、排除非实验因素干扰的研究。2调:研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。3调常为实提供线索,实成果又须回到现场实践中去验证。
统计描述、统计推断:1~统计分析两基本内容。2描:通过绘制统计图表和计算数据分布特征的基本统计量来了解样本观察值的分布特征,为进一步的推打下基础。3推:包括参数估计、假设检验,通过样本或检验统计量推断总体未知参数和未知总体分布的统计分析方法。
统计假设检验:1研究者实现根据现有知识对未知总体的分布和位置参数作出每种假定,在通过一次新实验(观察)结果推断假定是否成立的一种统计推断方法。2步骤:建立假设检验(干预前H0:u1=u0:干预后H1,u1≠u0),确定检验水准α;计算相应检验统计量;确定P值,作出推断结论。
直线相关、直线回归:1资料要求:归:因变量Y在给定X=X0的条件下服从正态分布;X是可以精确测量和严格控制的变量,I型回归。关:两个变量XY服从双变量正态分布,这种资料若进行回归分析称II,可计算两个回归方程。2应用:相关分析描述两变量间线性关系的密切程度和方向,回归分析说明两变量间一寸变化的数量关系,揭示X对Y的影响大小,对回归方程进行预测控制。3统计量:回归分析:截距a、回归系数b,有单位。相关分析:相关系数r,无单位。4联系:r、b符号一致即对一组数据若同时计算rb,他们正负号一致;假设检验等价:对同一样本rb假设检验得到的t值相等。用回归解释相关,决定系数r^2=(SS回归)/(SS总)。
精密度、准确度:1精:对同一标本进行多次重复测定时,测定值与平均测定值得接近程度,属随机误差。标准差、变异系数表示。越小测定方法重现性越好。准:测定值与真挚接近程度,说明测定方法有无系统误差。偏离100%较大时,测定方法存在系统误差。2准精均为评价检测方法可信赖程度的指标。准为首要指标。当测定方法存在系统误差时精在高也不能采用此方法。测定方法精差,准不会高。
配对设计、成组设计:1成:完全随机设计、单因素设计,将同质受试对象随机分到个处理组中进行试验挂差或从不同总体重随机抽样进行对比的方法。2配:将受试对象按某些特征或条件配成对子,分别把每对中两受试对象随机分配到试验组和对照组,再给予每队中个体以不同处理。连续实验若干对,观察对子间差别有无意义的方法。
假设检验中P、α:1P:由原假设H0所附iding的总体做同样的重复试验,获得≥或≤当前检验统计量的概率。2α:检验水准、显著性水准,是预先规定的判断小概率时间的概率尺度,通常规定为0.05或0.01。3假设检验规定:若若一次实验结果P≤α,拒绝H0,统计结论为“差别有统计学意义”。P>α,则不拒绝H0,统计结论为“无”。
概率事件、小概率事件:概:随机事件发生可能性大小的客观度量指标。小:概率P≤0.05的随机事件,即在一次观察或实验中不可能发生的事件。
斜率、截距:是直线回归方程y=a+bx中的两参数ab,a为常数,统计学意义为当X取值为0时相应Y值的均属估计。b:回归系数,表当X变化一个单位时Y平均改变的估计值。
专业设计、统计设计:1专:主要考虑专业方面需要,如研究对象的选择、实验技术与方法的确定、实验设备与试剂的要求。特点:必须具有先进性、新颖性、可行性。2统:要制定出统计研究方法的类型,抽样方法或实验对象分配方案,对照设置方式,研究对象数量估计等。强调如何保证按研究目的的要求获得可靠的研究结果,必具可靠性、科学性、有效性。
系统误差、随机误差:1系:在一定条件下,由于某种(受试对象、研究者或实验条件)偏倚是的观测值出现的倾向性偏差,表现为恒定偏大或偏小或周期性变化,不可避免。2随:偶然误差,在排除了系统误差后仍然存在的有一些有关实验因素微小随机波动引起的方向不定又可相互抵偿的误差,决定了测量的精密度。一次测量中~的大小方向不可预言。但大量重复测定中~的出现具有统计规律性。
完全随机设计、完全随机区组设计:1完:单因素设计、成组设计。将同质受试对象随机分到各处理组进行实验观察或从不同总体中随机抽样进行对比的方法。2区:配伍组设计,配对设计的扩展,将几个条件(病人的病种、病型、族别、性别、年龄、生活习惯、工作环境等)相似受试对象配成一个区组,在各区组内按随机原则分组,每组分别给予不同处理方法。
析因设计:多因素的交叉分组设计,对各因素各水平的所有组合都进行实验的设计方法,既可分析各因素主效应,又可分析各因素交互作用,是一种高效的实验设计方法。优点:实验结果可用方差分析,把总变异分解为众多个因素变异、因素见交互作用的变异以及误差变异;可节约样本含量。缺:统计分析较复杂。
方差分析:建立在数据变异结构基础之上的F分布小概率事件院里,基本思想:分析变异,即将总数据总变异分解为各种原因引起的变异和随机误差引起的变异,通过比较来源的变异,推断处理组间有无差别。
组间变异、组内变异:1间:由各组处理不同引起的变异。SS组间。其值大小用各组均属与总均属的离均差平方和表示。2内:由于个体差异引起每组内测量数据大小不等导致的变异,即有随机误差引起的变异。SS组内。其值大小用各组内部所有数据的均数与该组均属的离均差平方和之和表示。3均方值F(平均变异大小)=(SS组间/v组间)/(SS组内/v组内)。
重复测量设计、随机区组设计:1重:先给予受试对象不同处理,再重复观察每一受试对象某项观察指标,观察不同处理组间随重复测量因素-时间的变化某项指标的变化趋势,目的:关心各个处理组间随时间变化所观测指标的变化趋势。2随:将收视对象按一定条件进行匹配,再将每一区组受试对象随机分配到不同处理组,在控制主要的非处理因素的基础上比较不同处理组间的效应。目的:控制处理因素外其他因素对实验结果的影响,使各处理间尽量做到均衡化可比。
最小二乘法原则:使各实际散点y到回归直线y的纵向距离的平方和(Σ(y-y)^2)最小。
SS总、SS剩、SS回:1总=Σ(y-y)^2,y的离差平方和,未考虑X与Y的回归关系时Y的总变异,v=n-1。2剩=Σ(y-y)^2,剩余平方和,X对Y的线性影响之外的一切因素对Y的变异,总变异中无法用X解释的部分,越小回归效果越好,v=n-2。3回=Σ(y-y)^2,回归平方和,由于XY的直线关系而使Y变异减小的部分,总变异中可以用X解释的部分,越大回归效果越好,v=1。
点估计、区间估计:1点:直接用随机样本的样本均数X作为总体均数μ的一个估计,用样本的标准差S作为总体标准差σ的一个估计,直接用样本统计量X±S作为总体参数μ±σ的估计值。2区:按预先给定的概率1-α用一个区间来估计总体均数,这个区间成为可信度1-α的可信区间CI或置信区间。预先给定的1-α成为可信度或置信度,常取95%或99%。3二者为参数估计的两种方式。
决定系数R^2=SS回/SS。1总回归平方和与总平方和之比。2取值在0-1且无单位,数值大小反映回归贡献的相对成都,即在Y的总变异中回归关系所能解释的百分比。3既可作为回归拟合效果的概括统计量,也可以利用它对回归作假设检验。
变异系数CV=标准差/算术平均数。度量相对离散程度的指标。CV↑离散程度↑。
观察性研究、实验性研究:1观:对研究对象不加任何干预措施,在完全自然状态下观察记录各研究对象特征,描述现象的本质,比较不同环境条件下疾病的发生发展。可在相应人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组。2实:对研究对象认为是假干预措施,在干预前研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间差异。
构成比、率:1描述计数资料两常用指标。2购:某事物内部各部分所占比例或比重,与时间单位无关。3率:单位时间内某事件发生的可能性大小(频率、概率),与时间单位有关,有速度和强度的含义。
调查与实验区别:实:研究者主动安排实验因素,控制实验条件、排除非实验因素干扰的研究。调:研究者较被动进行观察,希望尽可能减少或控制非实验因素干扰的研究。
系统误差/偏倚:选择性、测量、混杂偏倚。
抽样误差:随机误差或够然误差,在排除了系统误差后仍然存在的由一些有关实验因素微笑随机波动引起的方向不定又可相互抵偿的误差,反映测量的精密度。一次测量中大小方向不可预言,大量重复测定中,出现具有统计规律性。
试验设计基本原则:对照原则、随机原则、重复原则。
估计样本含量的先决条件:第I类错误概率的大小、II。
确定样本量含量主要依据:I、II、容许误差和总体标准差或总体率。
方差分析结果检验方法:为F>F0.05(v1.v2),P<0.05,若在进行个处理水平组间两两比较,应采用q检验,因为若采用各组处理的t检验,或增加犯I类错误的概率。
原始变量数据交换目的:偏态正态化、曲线直线化、方差齐性。
一元线性(直线)回归分析:Sy-x:y剩余标准差(扣除x对y线性影响后对回归线的离散程度)。Sb:回归系数标准误。
抽样方法:单纯随机、系统、分层随机、整群、多阶段、非概率抽样。
正态分布曲线下P{u<x<u+2.58}=49.5。
总体均数可信区间:估计的理论基础:样本均数抽样分布规律。公式:(X-a·Sx, X+a·Sx)1.96,1.65,2.58,2.33。(95,99,单,双)
评价诊断试验优劣常用指标:精确度、特异度。
医学统计学工作基本步骤:统计设计、收集~、分析~、整理资料。
选择指标注意:客观性、有效性(灵敏、特异)、准确性(准确度、精确度即信度效度)。
制定医学正常值范围方法:平均数(正态分布资料)、中位数(任意分布资料)。
两样本均数:︱t︱>0.05,P<0.05,拒绝H0,两样本均数差别有显著性。
相关系数r:表示两变量间相互关系的密切程度、方向性。
随机数字表:实现抽样、分组随机化的主要手段(工具)。
常用调查方法:普查、抽样调查、典型调查。
根据受试对象不同将试验研究分为:动物、临床、社区研究。
同质计量资料数字特征描述:集中趋势、离散趋势。
试验设计减小误差四原则:对照、随机、重复、盲法。
医学资料来源:统计报表、医疗卫生日常记录、专题实验调查。
试验设计三要素:设置处理因素、受试对象、实验效应。
假设检验基本原理:小概率事件在一次实验中几乎不可能发生。
统计推断所依据P值含义:拒绝原假设H0所犯I类型错误的概率。
进行简单线性回归分析条件:线性、独立、正态、等方差。
调查与实验区别:实:研究者主动安排实验因素,控制实验条件、排除非实验因素干扰的研究。调:研究者较被动进行观察,希望尽可能减少或控制非实验因素干扰的研究。
系统误差/偏倚:选择性、测量、混杂偏倚。
抽样误差:随机误差或够然误差,在排除了系统误差后仍然存在的由一些有关实验因素微笑随机波动引起的方向不定又可相互抵偿的误差,反映测量的精密度。一次测量中大小方向不可预言,大量重复测定中,出现具有统计规律性。
试验设计基本原则:对照原则、随机原则、重复原则。
估计样本含量的先决条件:第I类错误概率的大小、II。
确定样本量含量主要依据:I、II、容许误差和总体标准差或总体率。
方差分析结果检验方法:为F>F0.05(v1.v2),P<0.05,若在进行个处理水平组间两两比较,应采用q检验,因为若采用各组处理的t检验,或增加犯I类错误的概率。
原始变量数据交换目的:偏态正态化、曲线直线化、方差齐性。
一元线性(直线)回归分析:Sy-x:y剩余标准差(扣除x对y线性影响后对回归线的离散程度)。Sb:回归系数标准误。
抽样方法:单纯随机、系统、分层随机、整群、多阶段、非概率抽样。
正态分布曲线下P{u<x<u+2.58}=49.5。
总体均数可信区间:估计的理论基础:样本均数抽样分布规律。公式:(X-a·Sx, X+a·Sx)1.96,1.65,2.58,2.33。(95,99,单,双)
评价诊断试验优劣常用指标:精确度、特异度。
医学统计学工作基本步骤:统计设计、收集~、分析~、整理资料。
选择指标注意:客观性、有效性(灵敏、特异)、准确性(准确度、精确度即信度效度)。
制定医学正常值范围方法:平均数(正态分布资料)、中位数(任意分布资料)。
两样本均数:︱t︱>0.05,P<0.05,拒绝H0,两样本均数差别有显著性。
相关系数r:表示两变量间相互关系的密切程度、方向性。
随机数字表:实现抽样、分组随机化的主要手段(工具)。
常用调查方法:普查、抽样调查、典型调查。
根据受试对象不同将试验研究分为:动物、临床、社区研究。
同质计量资料数字特征描述:集中趋势、离散趋势。
试验设计减小误差四原则:对照、随机、重复、盲法。
医学资料来源:统计报表、医疗卫生日常记录、专题实验调查。
试验设计三要素:设置处理因素、受试对象、实验效应。
假设检验基本原理:小概率事件在一次实验中几乎不可能发生。
统计推断所依据P值含义:拒绝原假设H0所犯I类型错误的概率。
进行简单线性回归分析条件:线性、独立、正态、等方差。
样本、总体:1总体:根据研究目的确定的同性质的所有研究对象的某项或某几项指标测量值的几个。根据总体积和所包括元素是否有限分为有限总体、无限总体。具有特定的分布特征和参数。2样本:以某种方式按预先规定的概率从总体重随机抽取、足够数量、能代表总体分布特征的一部分观察单位某指标数据的集合。3关系:根据研究目的,从总体重抽取部分有代表性的样本,用样本统计量推断总体参数。
标准差、标准误:1差S:单个测量值对其均数x的离散程度。误Sx或Sp:样本统计量对总体参数的离散程度。2差越大误越大。3差描述观测值变异范围。误推断估计总体参数的可信区间和假设检验。4计算公式:
I型错误、II型错误:1假设检验无论接受或拒绝原假设均有可能犯错误。2,I:在假设检验中拒绝了一个实际成立的原假设所犯的错误,概率记α。II:~中接受实际不成立,β。3当样本含量确定时,α↑β↓,反之~。4增大样本含量αβ↓。
正态分布、二项分布:1正:连续型随机变量X常见而重要的分布。若X在实数范围内取值且具有其相应的概率密度、概率分布函数,则X服从正。记为X~N(μ,σ^2)。2二:离散型随机变量的分布。在n次Bemoulli试验中,结果A出现K次这一随机事件的分布,记为X~B(n,π)。概率计算公式为P(X=k)=n!/k!(n-k)!。
取值范围、可信区间(X±1.96S、X±t0.05/2,v Sx):1X:算术平均数,描述一个变量所有观察值的平均水平,适用于频数分布对称的数据。S:标准差,~所有观察值与均数的平均离散程度。Sx:标准误,反应样本均数间离散程度、与相应总体均数间差异,说明均熟抽样误差大小的指标,均数大小成正比,与样本含量n的平方根成反比。Sx=S/根号n。t0.05/2,v:自由度为v双侧尾部面积为0.05的t界值。2 X±1.96S:从正态总体中抽样样本含量较大时,观测值95%的波动范围。X±t0.05/2,v Sx:从~时,总体均数95%可信区间(置信区间)。
处理因素、混杂因素:1处:实验性因素。对受试对象机遇的某种主动是假或客观存在的外部干预或措施。2混:在实验研究中除了处~对实验结果产生影响外的一切非处~。这些因素有的可控有的不可控。3在同一实验研究中,处应相对固定统一标准,尽量控制避免非处。
计量资料、计数资料:1量:通过度量衡方法测量每一观察单位某项指标的量的大小而得到的一系列数据资料。多有度量衡单位、为连续性资料。2数:将全体观测单位按照某种性质或特征分组,然后在分别清点各组单位的个数而得到的数据资料。无度,多为间断性资料。
单侧检验、双侧检验:1备择假设H1:u1≠u2,u检验的检验水准取双侧概率a/2,u检验的检验界值定位ua/2(标准正态分布的右侧界值,ua/2>0),无论检验统计量u正负,只要∣uα/2∣>0,都拒绝H0接受H1,这种只检验差别不管差别方向的双向检验称为~。2备择假设H1:u1>u2,此时只关心u>0情况,u检验的检验水准取单侧概率a,u检验的检验界值定位ua(标准正态分布右侧界值,ua>0),若备择假设H1:u2<u1,此时只关心u<0的情况,u检验的检验界值定位-ua,这种只关心差别单侧方向的单向检验~。
Sb、Sy.x:1Sb=Sy.x/根号下Σ(x-x)^2,回归系数标准误。2Sy.x=根号下(Σ(y-y)^2/(n-2))=根号下(SS剩/(n-2)),表示y的剩余标准差,即扣除x对y的线性影响后y对回归线的离散成都,度量了实际散点远离回归直线的离散成都,反映了模型的可靠性,越小模型越好。
调查研究、实验研究:1实:研究者主动安排实验因素、控制实验条件、排除非实验因素干扰的研究。2调:研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。3调常为实提供线索,实成果又须回到现场实践中去验证。
统计描述、统计推断:1~统计分析两基本内容。2描:通过绘制统计图表和计算数据分布特征的基本统计量来了解样本观察值的分布特征,为进一步的推打下基础。3推:包括参数估计、假设检验,通过样本或检验统计量推断总体未知参数和未知总体分布的统计分析方法。
统计假设检验:1研究者实现根据现有知识对未知总体的分布和位置参数作出每种假定,在通过一次新实验(观察)结果推断假定是否成立的一种统计推断方法。2步骤:建立假设检验(干预前H0:u1=u0:干预后H1,u1≠u0),确定检验水准α;计算相应检验统计量;确定P值,作出推断结论。
直线相关、直线回归:1资料要求:归:因变量Y在给定X=X0的条件下服从正态分布;X是可以精确测量和严格控制的变量,I型回归。关:两个变量XY服从双变量正态分布,这种资料若进行回归分析称II,可计算两个回归方程。2应用:相关分析描述两变量间线性关系的密切程度和方向,回归分析说明两变量间一寸变化的数量关系,揭示X对Y的影响大小,对回归方程进行预测控制。3统计量:回归分析:截距a、回归系数b,有单位。相关分析:相关系数r,无单位。4联系:r、b符号一致即对一组数据若同时计算rb,他们正负号一致;假设检验等价:对同一样本rb假设检验得到的t值相等。用回归解释相关,决定系数r^2=(SS回归)/(SS总)。
精密度、准确度:1精:对同一标本进行多次重复测定时,测定值与平均测定值得接近程度,属随机误差。标准差、变异系数表示。越小测定方法重现性越好。准:测定值与真挚接近程度,说明测定方法有无系统误差。偏离100%较大时,测定方法存在系统误差。2准精均为评价检测方法可信赖程度的指标。准为首要指标。当测定方法存在系统误差时精在高也不能采用此方法。测定方法精差,准不会高。
配对设计、成组设计:1成:完全随机设计、单因素设计,将同质受试对象随机分到个处理组中进行试验挂差或从不同总体重随机抽样进行对比的方法。2配:将受试对象按某些特征或条件配成对子,分别把每对中两受试对象随机分配到试验组和对照组,再给予每队中个体以不同处理。连续实验若干对,观察对子间差别有无意义的方法。
假设检验中P、α:1P:由原假设H0所附iding的总体做同样的重复试验,获得≥或≤当前检验统计量的概率。2α:检验水准、显著性水准,是预先规定的判断小概率时间的概率尺度,通常规定为0.05或0.01。3假设检验规定:若若一次实验结果P≤α,拒绝H0,统计结论为“差别有统计学意义”。P>α,则不拒绝H0,统计结论为“无”。
概率事件、小概率事件:概:随机事件发生可能性大小的客观度量指标。小:概率P≤0.05的随机事件,即在一次观察或实验中不可能发生的事件。
斜率、截距:是直线回归方程y=a+bx中的两参数ab,a为常数,统计学意义为当X取值为0时相应Y值的均属估计。b:回归系数,表当X变化一个单位时Y平均改变的估计值。
专业设计、统计设计:1专:主要考虑专业方面需要,如研究对象的选择、实验技术与方法的确定、实验设备与试剂的要求。特点:必须具有先进性、新颖性、可行性。2统:要制定出统计研究方法的类型,抽样方法或实验对象分配方案,对照设置方式,研究对象数量估计等。强调如何保证按研究目的的要求获得可靠的研究结果,必具可靠性、科学性、有效性。
系统误差、随机误差:1系:在一定条件下,由于某种(受试对象、研究者或实验条件)偏倚是的观测值出现的倾向性偏差,表现为恒定偏大或偏小或周期性变化,不可避免。2随:偶然误差,在排除了系统误差后仍然存在的有一些有关实验因素微小随机波动引起的方向不定又可相互抵偿的误差,决定了测量的精密度。一次测量中~的大小方向不可预言。但大量重复测定中~的出现具有统计规律性。
完全随机设计、完全随机区组设计:1完:单因素设计、成组设计。将同质受试对象随机分到各处理组进行实验观察或从不同总体中随机抽样进行对比的方法。2区:配伍组设计,配对设计的扩展,将几个条件(病人的病种、病型、族别、性别、年龄、生活习惯、工作环境等)相似受试对象配成一个区组,在各区组内按随机原则分组,每组分别给予不同处理方法。
析因设计:多因素的交叉分组设计,对各因素各水平的所有组合都进行实验的设计方法,既可分析各因素主效应,又可分析各因素交互作用,是一种高效的实验设计方法。优点:实验结果可用方差分析,把总变异分解为众多个因素变异、因素见交互作用的变异以及误差变异;可节约样本含量。缺:统计分析较复杂。
方差分析:建立在数据变异结构基础之上的F分布小概率事件院里,基本思想:分析变异,即将总数据总变异分解为各种原因引起的变异和随机误差引起的变异,通过比较来源的变异,推断处理组间有无差别。
组间变异、组内变异:1间:由各组处理不同引起的变异。SS组间。其值大小用各组均属与总均属的离均差平方和表示。2内:由于个体差异引起每组内测量数据大小不等导致的变异,即有随机误差引起的变异。SS组内。其值大小用各组内部所有数据的均数与该组均属的离均差平方和之和表示。3均方值F(平均变异大小)=(SS组间/v组间)/(SS组内/v组内)。
重复测量设计、随机区组设计:1重:先给予受试对象不同处理,再重复观察每一受试对象某项观察指标,观察不同处理组间随重复测量因素-时间的变化某项指标的变化趋势,目的:关心各个处理组间随时间变化所观测指标的变化趋势。2随:将收视对象按一定条件进行匹配,再将每一区组受试对象随机分配到不同处理组,在控制主要的非处理因素的基础上比较不同处理组间的效应。目的:控制处理因素外其他因素对实验结果的影响,使各处理间尽量做到均衡化可比。
最小二乘法原则:使各实际散点y到回归直线y的纵向距离的平方和(Σ(y-y)^2)最小。
SS总、SS剩、SS回:1总=Σ(y-y)^2,y的离差平方和,未考虑X与Y的回归关系时Y的总变异,v=n-1。2剩=Σ(y-y)^2,剩余平方和,X对Y的线性影响之外的一切因素对Y的变异,总变异中无法用X解释的部分,越小回归效果越好,v=n-2。3回=Σ(y-y)^2,回归平方和,由于XY的直线关系而使Y变异减小的部分,总变异中可以用X解释的部分,越大回归效果越好,v=1。
点估计、区间估计:1点:直接用随机样本的样本均数X作为总体均数μ的一个估计,用样本的标准差S作为总体标准差σ的一个估计,直接用样本统计量X±S作为总体参数μ±σ的估计值。2区:按预先给定的概率1-α用一个区间来估计总体均数,这个区间成为可信度1-α的可信区间CI或置信区间。预先给定的1-α成为可信度或置信度,常取95%或99%。3二者为参数估计的两种方式。
决定系数R^2=SS回/SS。1总回归平方和与总平方和之比。2取值在0-1且无单位,数值大小反映回归贡献的相对成都,即在Y的总变异中回归关系所能解释的百分比。3既可作为回归拟合效果的概括统计量,也可以利用它对回归作假设检验。
变异系数CV=标准差/算术平均数。度量相对离散程度的指标。CV↑离散程度↑。
观察性研究、实验性研究:1观:对研究对象不加任何干预措施,在完全自然状态下观察记录各研究对象特征,描述现象的本质,比较不同环境条件下疾病的发生发展。可在相应人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组。2实:对研究对象认为是假干预措施,在干预前研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间差异。
构成比、率:1描述计数资料两常用指标。2购:某事物内部各部分所占比例或比重,与时间单位无关。3率:单位时间内某事件发生的可能性大小(频率、概率),与时间单位有关,有速度和强度的含义。
展开阅读全文