收藏 分销(赏)

医学统计学基本概念资料.doc

上传人:天**** 文档编号:4546188 上传时间:2024-09-27 格式:DOC 页数:13 大小:2.62MB
下载 相关 举报
医学统计学基本概念资料.doc_第1页
第1页 / 共13页
医学统计学基本概念资料.doc_第2页
第2页 / 共13页
医学统计学基本概念资料.doc_第3页
第3页 / 共13页
医学统计学基本概念资料.doc_第4页
第4页 / 共13页
医学统计学基本概念资料.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、 9. 均数可信区间和参考值范围区分 区分 可信区间 参考值范围 意义 未知参数可能范围 正常值波动范围 公式 s已知或s未知,但n足够大(xu a /2,sx)或(xu a /2 s,x) (xu a /2,sx) s未知( xt a, n s x) 用途 估量总体均数 判断正异常 小结:均数可信区间:均数界值标准误 个体允许区间(参考值范围):均数界值标准差 10. 可信区间与允许区间区分:见P44 11. 假设检验基本思想: 提出一个假设(H0); 验证这个假设。假如假设成立,会得到现在结果吗? 两种可能情况:(1)得到现在结果可能性很小(小概率) 拒绝H0 (2)有可能得到现在结果(不

2、是小概率) 没有理由拒绝H0 假设检验步骤:(1)建立检验假设;(2)确定检验水准;(3)计算检验统计量并求P值;(5)界定P值并作结论。 12. I 型错误和 II 型错误 实际情况 假设检验结果 拒绝 H0 不拒绝 H0 H0 成立 I 型错误(a) H0 不成立 把握度(1-b) II 型错误(b) 13. 差异检验和优度检验:差异检验之意义在于是否能够确认H1成立,故希望所得P 值很小,因为P 值越小,表示手头样本从H0总体随机取得之概率越小,即否定H0而确认H1成立把握越大。 优度检验之意义在于是否能够确认H0成立,故希望所得P值较大,因为P 值越大,表示手头样本从H0总体随机取得之

3、概率越大。 14. 可信区间与假设检验区分和联络:可信区间说明量大小即推断总体均数范围,假设检验推断质不一样即判断两总体均数是否不等;可信区间可回答假设检验问题,可信区间若包含了H0 ,按a水准,不拒绝H0;若不包含H0 ,按a水准,拒绝H0 ,接收H1; 可信区间不但能回答差异有没有统计学意义,还能提醒差异有没有实际专业意义;可信区间不能够完全代替假设检验。可信区间只能在预先要求概率a前提下进行计算,假设检验能取得一较为确切P值。 15. 以下说法正确吗? P 是H0成立概率。(错) P 是 I 型误差概率。(错)P是 H0 成立时,取得现有差异概率。(错) P 是 H0 成立时,取得现有差

4、异以及更大差异概率。(对) 统计推断时风险。(错) 拒绝H0时所冒风险。(对) 16.t检验应用条件:(1)独立性:各观察个体间是相互独立,不能相互影响,亦不能一方影响另一方;(2)正态性:两组均数比较时,要求两组数据服从正态分布;配对设计时,要求差值服从正态分布。(3)方差齐性:两样本所对应正态总体之方差相等。 17. 总体方差不相等t 检验 :(1)数据变换后进行t 检验;(2)秩转换非参数检验;(3)近似t检验 t检验。 18. 两样本均数比较方法选择 方差齐 方差不齐小样本 t 检验 t 检验 大样本 u 检验 u 检验 19.方差分析基本思想:方差分析(analysis of var

5、iance)又称为变异数分析,采取F检验统计量,也称F检验。这种方法基本思想是对变异进行分解和分析,把全部观察值之间变异总变异,按照设计和需要分为两个或多个组成部分,再作分析, 从而达成统计推断之目标。总变异=组内变异+组间变异;组内变异:抽样(随机)误差(个体差异和测量误差);组间变异:组间本质差异抽样(随机)误差;假如组间无本质差异,则组间变异组内变异 MS或F Between =1MS Within20.方差分析优点:(1)不受比较组数限制;(2)可同时分析多个原因作用;(3)可分析原因间交互作用。 21. 方差分析意义:是按照试验设计把总变异分成若干部分,划分得越细,各部分涵义越明确,

6、对结论亦较易解释;同时,残余变异即误差部分越小,因而能够提升检验灵敏度和结论准确性。 22. F分布是方差比分布,惯用于方差齐性检验,方差分析等。 F 分布特征: (1) F 分布为一簇单峰正偏态分布曲线,与两个自由度关于。(2) 若F服从自由度为(n1,n2)F 分布,则其倒数1/F服从自由度为(n2,n1)F 分布。 (3) 自由度为(n1,n2)F 分布,其均数为n2/(n2-2),与第一自由度无关。 (4) 第一自由度n11时,F分布实际上是t分布之平方;第二自由度n2时,F分布实际上等于c2分布。 (5) 每一对自由度下F分布曲线下面积分布规律,见方差分析用F 界值表,表中横标目为第

7、一自由度,纵标目为第二自由度,表中分别给出了右侧尾部概率为0.05 和0.01时F界值。 23.方差分析表 变异起源 SS v MS F P 组间 SS组间 k-1 SS组间/v组间 MS组间/ MS组内 组内 SS组内 N-k SS组内/v组内 总 SS总 N-1 24.方差分析与t检验关系当比较两个均数时,从同一资料算得之 F 值与t值有以下关系:F = t2 可见在两组均数比较时,方差分析与t检验效果是完全一样。 25. 方差分析后两两比较(多重比较)几个方法: 一、SNK q检验(多个均数间全方面比较) 二、LSD t检验(有专业意义均数间比较) 三、Dunnett检验 (多个试验组与

8、对照组比较) 还有TUKEY 、DUNCAN 、 SCHEFFE 、 WALLER 、BON 等比较方法各组间比较用SNK 法; 各试验组与某一对照组间比较用Dunnet法。 26. 方差分析应用条件: 各样本是相互独立随机样本; 各样原来自正态总体; 各组总体方差相等,即方差齐。 方差分析和t检验要求: 独立性、正态性、方差齐性。 27. 总结:均数、方差比较: 样本均数与总体均数比较( t 检验) 配对设计样本均数比较(配对t 检验) 两样本均数比较 ( t 检验, u 检验, F 检验, SNK, Duncan) 多样本均数比较( F 检验,ANOVA ) 各组间比较(SNK 法); 各

9、试验组与某一对照组间比较用(Duncan 法) 两个方差比较( F 检验) 多个方差比较( Bartlett 检验 28. 二项分布应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考查是否满足以下应用条件: (1) 每次试验只有两类对立结果;如阳性或阴性、生存或死亡,不允许考虑“可疑”等含糊结果,属于二项分类资料。 (2) n次事件相互独立;即每个观察单位观察结果不会影响到其它观察单位结果。如要求疾病无传染性、无家族聚集性等。 (3) 每次试验某类结果发生概率是一个常数。已知发生某一结果(如阳性)概率为,其对应概率必定是(1-),我们知道总体率通常是

10、未知,在实际工作中要求是从大量观察中取得比较稳定数值。 29.二项分布应用:(1)样本率与总体率比较;(2)两样本率比较。 30. Poisson分布特征: 非对称,但增大时趋于对称; 均数与方差均为; 分布可加性, n个独立Poisson分布相加仍符合Poisson分布,可使20,使得可用正态近似。 31. Poisson分布应用条件:(1)平稳性:X 取值与观察单位位置无关;(2)独立增量性:在某个观察单位X 取值与前面各观察单位上X 取值独立.;(3)普通性:在充分小观察单位上X 取值最多为1。 32. Possion分布应用:(1)总体均数估量;(2)样本均数与总体均数比较;(3)两样

11、本均数比较。 33.2检验用途:(1)推断多个总体率之间有没有差异(2)推断几组总体组成比之间有没有差异 (3)两个变量之间有没有关联性(4)频数分布拟合优度检验。 34. 2检验基本思想:2= ()-TA2T 假如H0 假设成立,那么实际频数与理论频数应该比较靠近。假如实际频数与理论频数相差很大,超出了抽样误差所能解释范围,则可认为H0 假设不成立,即两样本对应总体率不等。2值反应了实际频数与理论频数吻合程度。假如两总体率相同假设成立,则实际频数与理论频数之差异纯系抽样误差所致,故通常不会很大,2值也就不会很大;在一次随机试验中,出现大2值概率P是很小。所以,若依照实际样本资料求得一个很小P

12、,且P(检验水准),依照小概率原理,就有理由怀疑H0假设真实性,因而拒绝它;若P,则没有理由拒绝H0。2值大小除取决于A-T差值外,还与基本数据格子数关于,严格地说是与自由度关于。在x2检验中,自由度指在表中周围共计不变前提下,基本数据能够自由变动格子数 。 35. x2检验精华:检验实际频数和理论频数吻合程度。假如实际频数和理论频数越吻合,说明H0 假设成立可能性就越大,反之,假如实际频数和理论频数相差越远,说明 H0 越不可能成立。 36.普通四个表资料卡方检验公式选取条件: 1) n40,且T5时,用未校正值 c2 =(ad -bc)2 n(a +b)(c+d)(a +c)(b +d)

13、2) 1T5(,且A-nT40-时,宜用校正0.5)2值 (ad-bc-n/2) c2 c2n2 =2 =()()()()Ta+b c+d a+c b+d 3) T1 或n40时,宜用确切概率计算法 (a+b)!(c+d)!(a+c)!(v+d)!P = a!b!c!d!n! 37. 行列表2值计算专用公式: A 2 c2= n n n -1 RC38. 行列表资料采取2检验时,注意事项: (1) 注意理论数大小。行列表资料采取2检验时,对理论数要求与四格表资料相同,不能有T1,T5 个数不能超出全部理论数个数1/5(四格表中有一个T50mg” ) 44. 非参数检验适用情况:总体分布形式未知

14、或分布类型不明;偏态分布资料: 等级资料:不能精准测定,只能以严重程度、优劣等级、次序先后等表示; 不满足参数检验条件资料:各组方差显著不齐。 数据一端或两端是不确定数值,如“50mg”等。 45.秩和检验适用范围:(1)等级资料;(2)定量资料,但数据某一端或两端无确定数值(开口资料);(3)定量资料,但数值分布是极度偏态,如L形分布,或个别数值偏离过大而不属于“过失误差”者;(4)定量资料,但各组离散程度相差悬殊,即使经变量变换,也难以达成方差齐性;(5)定量资料,但分布型还未确知,此时可先用秩和检验法进行分析;(6)兼有等级和定量性质资料。 46.秩和检验优缺点: 优点 :不论样本所来自

15、总体分布形式怎样,甚至是未知,都能适用。 一些非参数方法计算简便。所以在急需取得初步结果时可采取。 易于了解和掌握。可用于不能或未加精准测量资料,如等级资料或一些记数资料。 缺点:对适宜用参数方法资料,若用非参数法处理,常损失部分信息,降低效率。 即使许多非参数法计算简单,但不少问题计算仍嫌繁冗。 47.样本相关系数r 特征:(1) -1 r 1,没有单位; (2)r 绝对值大小表示相关关系亲密程度; (3) r 符号表示相关方向:r0为正相关;r0为负相关;r0为零相关或无相关 48. 回归系数和回归方程意义及性质: Y =a +bX (1)b 意义:回归系数b称为斜率,表示自变量增加一个单

16、位时,应变量平均改变量。 (2)a 意义:a为截距或常数项,a值表示当X=0 时,应变量Y 估量值。从坐标轴上看,a对应回归直线延伸至X=0 时与Y 轴交点,故称为截距。 (3)Y(Y-hat)意义: Y表示给定X 时Y 平均值估量。Y涵义是均数不一样X时Y均数估量值,与通常均数计算方法不一样,这里均数是给定X条件下,由回归方程估量得到,故又称为条件均数。 (4)Y-Y意义:Y-Y称为剩下,又称残差,是Y观察值与对应估量值之差,在回归图中表示各散点到回归直线纵向距离。 (5) ( Y - Y )2意义:称为残差平方和 (residual sum of squares或剩下平)方和,是全部剩下之

17、平方和,综合表示点距直线距离。在全部直线中,回归直线残差平方和是最小。(最小二乘) 49. 回归直线关于性质: (1) 直线经过均点 (X,Y )(2) 直线上方各点到直线纵向距离之和 = 直线下方各点到直线纵向距离之和即: (Y -Y)=0(3) 各点到该回归线纵向距离平方和较到其它任何直线者为小。 ( )( )Y -Y = Y-Y 2 + Y -Y2 Y -Y = Y-a+bX 2 50. 应变量Y 总变异分解: ()SS =SS +SS 总回 剩SS n = n + n 决定系数 r2 = 回归总 回剩SS 总 v总v回v剩,v回=1, v剩=n-2。 51. 直线回归中三种假设检验间关

18、系: 在直线回归中,相关系数假设检验,回归系数假设检验,以及回归方程方差分析结果等价。 mt =t = F52. 可信区间与Y 允许区间: rbY可信区间是针对条件均数,而允许区间是针对Y 取值范围。 m允许区间估量 :给定 X 时 Y 估量值是 Y 均数一个估量。 Y给定X 时 Y 值允许区间是 Y 值可能范围。 53. 回归方程应用:(1)描述两个变量间依存关系。 (2)利用回归方程进行预测。 (3)利用回归方程进行估量。(4)利用回归方程取得更高精度参考值。 (5)利用回归方程进行控制。 54. 应用直线回归注意点: (1) .回归分析要有实际意义: 要有实际意义; 充分利用散点图,判断

19、:(1) 线性趋势 (2) 离群值 当样本含量较大时,统计学检验作用减弱; 回归关系能够内插,不宜外延; 自变量选择: 原因 轻易测量 变异小 年纪、身高、体重、体表面积 (2) 在作回归前应先作散点图 (3)内插和外延 55. 回归分析正确应用: 回归系数是有单位,不能依照 b 大小判断回归关系亲密程度。 应用条件(LINE):(1)线性(linear)(2)独立(independent)(3)给定X 时,Y 正态分布(normal)(4)等方差(equal variance。 )56直线回归分析和相关分析区分与联络: (1) 区分:在资料要求上:回归要求因变量Y 服从正态分布,X 是能够精

20、准测量和严格控制变量,通常称为I型回归;相关要求X 和Y 均服从双变量正态分布,称为II型回归。 在应用上:说明两变量依存改变数量关系用回归,说明变量间相关关系用相关。 (2) 联络:1)对一组数据同时计算r和b,它们正负号一致,r为+说明两变量间相互关系是同向,b为+说明X 增一个单位,Y 平均增b个单位。 2)r和b假设检验是等价。 57研究设计定义:在进行科学研究时,对研究方案作合理安排,以降低随机误差影响。采取适当研究试验次数,降低试验成本并能对数据进行有效分析,提升研究试验可靠信,从而实现研究目标。 研究设计作用:(1) 合理安排试验原因,提升研究质量。(2) 控制误差,使研究结果保

21、持很好稳定性。(3) 经过较少观察例数,获取尽可能丰富信息。 58研究设计包含专业设计与统计设计两个部份。 统计设计主要是依据研究目标,从研究现况条件出发,要求研究原因、选择效应指标、确定研究对象引入方式方法和规模,拟实施方法、方案,及数据收集、整理分析模式,直至结果解释,进行系统安排,使其消耗最少人力和物力、时间,而取得可靠信息与结论。 59研究设计形式:在医学研究中,依照观察者是否主动施加干预而分为两类: 干预研究设计(试验研究)(类型:试验研究设计、临床试验设计、小区干预试验设计)、观察研究设计 (调查研究) 研究设计形式:前瞻性与回顾性 试验研究与调查研究 (前瞻性试验研究 前瞻性调查

22、研究 回顾性试验研究 回顾性调查研究) 61试验设计特点: (1)研究者能人为设置处理原因 (2)受试对象接收何种处理原因/水平是由随机分配而定。 (3)能使多个试验原因包含在较少次数试验中,更有效地控制误差,达成高效目标。 62研究原因与混杂原因:研究原因:主要研究指标,与研究结果(效应)相联络。混杂原因:干扰研究结果指标。 常见混杂原因:年纪、性别;病程、病情;疾病史、家族史、伴发疾病 对混杂原因处理:(1)采取良好设计:排除,平衡;(2)设计时考虑:改为修饰原因。 63试验设计(试验研究)基本要素、基本标准、基本内容、步骤、惯用试验设计方法、试验设计对照形式: 基本要素:处理原因、受试对象、试验效应 基本标准:对照(均衡性)、重复(可靠性)、随机(客观性) 基本内容和步骤:(1)建立研究假设(立题);(2)明确研究范围(应有严格纳入标准和排除标准);(3)确立处理原因(分清处理原因和非处理原因,并注意处理原因标准化);(4)明确观察指标(试验效应);(5)控制误差和偏倚。 惯用试验设计方法:(1)随机化分组方法;(2)完全随机分组方法;(3)配对设计;(4)配伍组设计及随机分组方法。 试验设计对照形式:(1)空白对照;(2)抚慰剂对照;(3)试验对照;(4)标准对照;(5)本身对照。

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 教育专区 > 统计财经学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服