收藏 分销(赏)

医学统计学期末考试重点.doc

上传人:a199****6536 文档编号:10674666 上传时间:2025-06-08 格式:DOC 页数:4 大小:52KB 下载积分:5 金币
下载 相关 举报
医学统计学期末考试重点.doc_第1页
第1页 / 共4页
医学统计学期末考试重点.doc_第2页
第2页 / 共4页


点击查看更多>>
资源描述
一、总体:是根据研究目的确定的同质观测单位的集合。 样本:是从统计总体中随机抽取的、具有代表性的部分观测单位的集合。 同质:即构成总体的各个观测单位在某一方面或几方面的性质相同或基本相同。 变异:是指在同质基础上各观测单位之间的差异。 离散型变量:指只能取可数的或有限个数的变量。特点只是取顺序整数值 连续性变量:指可以取各整数区间的一切实数值的变量。特点是在两个连续的整数值之间还可以用小数或分数连接起来的非整数值。 二、统计的含义 1.统计工作:指搜集、整理、分析和研究统计数据的工作,是统计数据与统计理论的基础和源泉。 2.统计数据:指统计工作研究的主体及成果。 3.统计学:是对研究对象的数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。 三、统计学的主要内容 1.研究设计:是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。 2.统计描述:用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是整个统计学的基础。 3.统计推断:用样本信息推论总体特征的归纳过程,它有两个重要领域。 四、误差及其分类 误差指实际观测值与真值之差或样本指标与总体指标之差。 误差分为非随机误差和随机误差, 非随机误差:粗差-粗心大意,无规律性,可以避免; 系统误差-仪器、方法、等条件的差异,感官、理论和实验方法的差异。 随机误差:测量误差-由一系列实验或观测条件的随机波动造成的实测值与真值之差; 抽样误差-随机抽样引起的统计量与参数之间的差异。 五、统计工作的基本步骤 研究设计、搜集资料、整理资料、分析资料 中医统计资料的搜集与整理 一、中医统计资料的类型 1.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所得资料,变量值大多有度量衡单位; 2.计数资料:是由分类变量产生的资料,即对每个观察单位按某种属性分组计数得到的资料,变量值变现为互不相容的属性或类别,无度量衡单位。 统计描述 一、频数分布:是指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。集中趋势和离散趋势是其两个重要特征。 集中趋势是指一组变量值的集中倾向或中心位置;离散趋势即一组变量值的离散倾向。它们是揭示数据分布的类型和正确进行统计描述与统计推断的前提。 频数分布表(频数表):是观测值或某些类别及其相应的频数按一定顺序排列的表格。 医学参考值范围:是为了减小变异的影响,提高参考值作为判定正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围。 率:表示某现象发生的频率或强度,是频率指标。 构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示。 相对比:描述两个有关指标的比例关系,指标可以是绝对数、相对数或平均数。 率的标准化:采用统一标准计算各率的标准化率,使各率具有可比性,目的是在比较总率时消除混杂因素的影响。 二、频数分布表/图的作用 1.描述频数分布的集中趋势与离散趋势,直观地揭示数据的分布特征和分布类型; 2.便于发现资料中某些远离群体的特大或特小的可疑值; 3.便于进一步计算统计指标和进行统计分析。 三、正态分布的特征 1.集中性、对称性和均匀变动性; 2. υ和σ是正态分布的两个参数,决定了整个分布图形;υ恒定时,σ越大,表示数据越分散,曲线越矮胖;反之… 3.任何均数为υ、标准差为σ的正态分布N(υ,σ2)都可以转换为均数为0、标准差为1的标准正态分布N(0,1)。 四、制定医学参考值范围的注意事项 1.需根据研究目的选定适当的百分界值,如80%、90%、95%、99%,常用95%; 2.根据指标的实际用途确定单侧或双侧界值; 3.根据资料的分布特点,选用恰当的计算方法; 4.根据专业知识确定是否需要按照年龄、性别等分组; 5有足够的样本量,一般不低于100例。 五、应用相对数的注意事项 1.计算相对数的分母不宜太小; 2.观察单位数不等的几个率不能直接相加求其合计率; 3.资料对比时应注意可比性; 4.资料分析时不能以构成比代替率。 参数估计 一、标准误:表示样本指标值在抽样分布中的变异情况,样本均数的标准差也称均数的标准误,描述同一总体中随机抽出n相同的多个样本均数间的离散型。 自由度:是某一统计量中取值不受限制的变量的个数。 二项分布:是对只具有两种互斥结果的离散型随机事件的规律性描述的一种概率分布。 柏松分布:是一种常见的离散型分布,用来描述单位面积、体积、时间、人群内等稀有或罕见事件发生的分布规律。 区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1—α可信区间。 准确度:是可信区间包含参数的概率大小,用可信度(1—α)表示。可信度越接近1,准确度越高。 精密度:是对参数估计的范围或长度的度量。可信区间的长度越小,其估计的精密度越高。 在可信度确定的情况下,通过增加样本量来减小SE,使得CI(可信区间)的长度减小,从而提高精密度。 二、抽样分布的特点 1.各样本均数未必等于总体均数; 2.各样本均数间存在差异; 3.样本均数呈正态分布; 4.样本均数的变异范围较原变量的变异范围小; 5.随着样本n增加,样本均数的变异程度减小; 6.若原始变量服从正态分布,则统计量服从正态分布。反之,当n较大时,统计量也服从正态分布;当n较小时,统计量为非正态分布。 三、标准差与均数标准误的区别 标准差:1.随着n的增大逐渐趋于稳定; 2.表示观测值变异大小; 3.结合均数描述正态分布的特征; 4.在正态分布时做参考值范围的估计; 5.计算变异系数和均数的标准误。 均数标准误:1.随着n的增大逐渐减小,与n的平方根成反比; 2.表示样本抽样误差的大小; 3.描述样本均数的可靠性; 4.结合均数估计总体均数的可信区间; 5.进行均数间差别的假设检验。 假设检验概述 一、假设检验:又称显著性检验,是利用赝本信息,根据一定的概率水准,推断样本指标(统计量)与总体指标(参数)、不同样本指标间的差别有无意义的统计分析方法。 无效假设:表示差别是由抽样误差引起,无统计学意义,记为H0。 备择假设:表示差别为处理因素所致,有统计学意义,记为H1。 I型错误:统计推断结果拒绝了实际上成立的H0,犯了“弃真”的错误。是指组间差异实际上不存在,统计推断的结果却错误地认为存在组间差异,故称为假阳性错误。 II型错误:统计推断结果不拒绝了实际上是不成立的H0,犯了“存伪”的错误。是指组间差异确实存在,而统计推断结果却未检出该差异,故成为假阴性错误。 二、假设检验的步骤 1.建立检验假设、确定检验水准; 2.选择检验方法、计算统计量; 3.确定P值、作出推论。 t检验 一、独立样本(两样本或成组)t检验的应用条件 1.样本来自同分布的总体,即同质性; 2.样本个体测量值相互独立; 3.两个样本所代表的总体均数服从正态分布; 4总体方差相等,即方差齐性。 F检验 一、完全随机设计:是将全体观察对象按随机化方法分配到各个处理组中,每个观察对象接受每种处理的机会均等。 随机区组设计:将全部受试对象按某种或某些特征分为若干个区组,每个区组内研究对象的特征尽可能相近,每个区组内的观察对象与处理因素的水平数相等,分别使每个区组内的观察对象随机地接受处理因素某一水平的处理。 二、F检验的基本思想 F检验的基本思路是分析变异,即将所以测量值间的总变异按照变异的来源分解为多个部分,通过比较不同来源的变异,推断各处理组间的差异有无统计学意义。因此,F检验法是一种在若干能相互比较的资料中,把产生变异的原因加以区分开来的方法与技术,其实质是关于观测值变异原因的数量分析。 χ2检验 一、χ2检验的基本思想 χ2检验实质上是检验A(实际频数)与T(理论次数)是否吻合及吻合程度,χ2越小,表明实际观察次数与理论次数越接近;χ2=0,表示两者完全吻合;χ2越大,表示两者相差越大。若检验假设成立,则A与T之差不会很大,出现大的χ2值的概率P是很小的,若P<=α(检验水准),就怀疑假设成立,因而拒绝它;若P>α,则没有理由拒绝它。 一、秩和检验:主要用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等,是效率较高的非参数的检验方法。 直线相关与回归 一、直线相关(简单相关):是用于判断两个变量之间有无直线相关关系,并回答相关的方向和相关程度如何的统计分析方法。 相关系数(r):是说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标。 直线回归:是用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法。 确定系数:相关系数的平方(r2)。 二、相关系数假设检验的注意事项 1.线性相关表示两个变量之间的关系是双向的,当散点图出现直线趋势时再作分析; 2.相关系数的计算只适用于两个变量都服从正态分布的资料; 3.样本相关系数r是总体相关系数ρ的一个估计值,r与ρ之间存在着抽样误差,必须作假设检验; 4.相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系。 三、直线相关与回归的区别与联系 区别:1.相关分析反映应变量y与自变量x间的互依关系,任何一个的变化都会引起另一个的变化,是一种双向变化的关系;回归分析体现y随x变化而变化的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。 2.相关是对两个变量之间的关系进行描述;回归是对两个变量做定量描述,研究两变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。 3.直线相关分析只适用于x、y服从双变量正态分布资料。直线回归既适用于y服从正态分布也适用于x、y服从双变量正态分布资料。 4.r与b的绝对值没有直线联系,b有单位,而r没有。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高;b的绝对值越大,回归直线越陡,说明当x变化一个单位时,y的平均变化就越大。反之也是一样。 5.两事物或现象间存在相关关系,不一定是因果关系,可能只是伴随关系。一旦两事物或现象间存在因果关系,则必然相关。 联系:1.对一组数据若同时计算r与b,它们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的;b为正说明x增(减)一个单位,y平均增(或减)b个单位。 2.r和b的假设检验等价,即对同一样本,两者的t值相等。则简单的r的假设检验可以代替对b的假设检验。 3.相关回归可以互相解释。r的平方成为确定系数,r2反映回归效果;确定系数也可从回归角度了解相关程度。 研究设计基础 一、专业设计的基本要素 1.受试对象:即试验所用的动物、各标本、患特定疾病的患者、健康志愿者等。 2.处理因素:即根据不同的研究目的欲施加给受试对象的某些干预措施。 3.试验效应:是处理因素作用于受试对象的客观反应和结局,往往通过观测指标来表达。 二、统计设计的基本原则 1.随机:指在抽样或分组时,每一个研究对象都不受研究者或研究对象主观因素的影响,机会均等地被抽取到或分配到某一组。(包括随机抽样和随机分组) 2.对照:即在调查或试验过程中,确立可供相互比较的组别,其目的在于控制各种混杂因素、鉴别处理因素与非处理因素的差异,消除和减少试验误差,提高研究结果的真实性和可靠性。 3.均衡:指实验组(或相互比较的组)之间非处理因素的相同或相近。均衡的意义在于使非处理因素在组别间达到均衡性或可比性,提高结论的真实性。 4.重复:包括足够的样本量和重复试验(或平行试验)结果的重现性两个方面。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服