ImageVerifierCode 换一换
格式:PDF , 页数:143 ,大小:7.55MB ,
资源ID:229919      下载积分:19 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/229919.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(统计学:第3章 总体均数的估计和假设检验.pdf)为本站上传会员【曲****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

统计学:第3章 总体均数的估计和假设检验.pdf

1、第三幸总体均教的估计与假设检睑1讲述内容:第一节均数的抽样误差与标准误第二节t分布第三节总体均数的估计第四节t检验第五节假设检验的注意事项第六节正态性检验和两样本方差比较 的尸检验附件2第一节均数的抽样误差与标准课3统计推新:由样本信息推断总体特征。II样本统计指标 总体统计才旨标(统计量)r参虬)正态r分布)总体:2V(,。2)推新4!说明!为说明抽样误差规律,先用一个实例,后 引出理论。例3-1若某市1999年18岁男生身高服从均 数=167.7cm、标准差b=5.3cm的正态分布。对 该总体进行随机抽样,每次抽10人,(%=10),共抽得100个样本(g=100),计算得每个样本均 数%

2、及标准差跖如图3-1和表3-1所示。图31 1999年某市18岁男生身高M167.7,5.3?)的抽样示意图5见P3436表316将此100个样本均数看成新变量值,则这100 个样本均数构成一新分布,绘制直方图。图3-2从正态分布总体M167.7,5.32)随机抽样所得样本均数分布7样本均数的抽样分布具有如下特点:X。4,各样本均数X未必等于总体均数;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本 对称。样本均数的变异范围较之原变量的变异范围大 大缩小。可算得这100个样本均数的均数为16769cm、标准 差为L69cm。81、抽样误差:由个体变异产生的、抽样造成的样 本统计量

3、与总体参数的差别均数的抽样误差:由于抽样逵成的 样本均数与总体均数的差别原因:1)抽样2)个体差异9同理,在非正态分布总体中也可进行类似的抽样 研究。若Xi服从正态分布 则x j服从正态分布大:则 先 近似服从正态分布若X,不服从正态分布1 _小:则X,为非正态分布本书以n=60为界限102、标准根(standard error,SE)表示样本统计量抽样误差大小的统计 指4。均教标准根:说明均数抽样银差的 大小,总体计算公式b葭=5(3-1)实质:样本均数的标准差11数理统计证明:x=x;ax t分布理论(桥梁)总体T目的15一、t分布的概念1.若某一随机变量X服从总体均数为4、总体 标准差为

4、。的正态分布N(,),则可通过u变换 X-(丁)将一般正态分布转化为标准正态分布N(02),即U分布;162.若样本均数服从总体均数为、总体标准差为5的正态分布N(,匹),则通X-LI过同样方式的变换 T)也可将其转换为标准正态分布N(0,f),即U分布。173,实际工作中,由于by未知,用Sy代咨,A A则(X 4)/Sx不再服从标准正态分布,而 服从力分布。X LI X LI.Sx s”式 中好&4 由度(degree of freedom,df)18二、分布的图形与特征t分布只有一个参数,即自由度V,分布是一簇曲线。当自由度。不同时,曲线的形状不同。当/一 8时,分布趋近于标准正 态分布

5、,但当自由度P较小时,与标准正态分布差 异较大。其图形如下:19-5.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 4.0 5.0图3-3不同自由度下的看分布图201.特征:单峰分布,以0为中心,左右对称;自由度越小,则r值越分散,r分布的峰部越矮而尾部翘得越高;当逼近8,5又逼近为分布逼近分布,故标准正态分布是,分布的特例。212,界值表:详见附表2,可反映,分布曲 线下的面收。单侧概率或单尾概率:用a/表示;双侧概率或双尾概率:用。2尸表示。22附表2 t界值表0自由度二,二概 率,P单侧0.250.200.100.050.0250.010.0050.00250.00

6、10.0005V,t双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713

7、.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587210.6860.8591.3231.7

8、212.0802.5182.8313.1353.5273.819220.6860.8581.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.3191.7142.0692.5002.8073.1043.4853.768240.6850.8571.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.3161.7082.0602.4852.7873.0783.4503.72523老师你好:教材P77对t界表的描述中说:同一概率下,自由度越大,t的绝对值越 大。但是从图象和表都可以看出,到了一定

9、 的程度后,t的绝对这又随自由度的增大 而减少(在同一概率下)。24举例:T)v=10,单a=0.05,%005,io=L812,则有P(t 1.812)=0.05 2)v=10,双。=0.05,办05/21o=2.228,则有P(t 2.228)=0.0525缉第三节总体均数的估计26一,参数估计用样本统计量推新总体参数。总体均数估计:用样本为数(和 标准差)推新总体均数。271.点估计(point estimation):就是用相应样本统计量直接作为其总体参数的 估计值。如用又估计、S估计b等。其 方法虽简单,但未考虑抽样误差的大小。282.区间估计(interval estimation

10、):按预先给定的概率(1-a)所确定的包含 来名参的*4范围o总体均数的区间估计:按预先给爱的 概率(l-a)所确定的包含未知总体均数的一范禺。如给定a=0.05,该范围称为参数的95%可信区 间或置信区间;如给定a=0.01,该范围称为参数的99%可信区 间或置信区间。29二、总体均数可信区间的计算30 总体均数可信区间的计算 需考虑:(1)总体标准差虎否已知,(2)样本含量的大小 通常有两类方法:(1)/分布法(2)分布法311.单一总体均数的可信区同(1)。未知:按,分布。双侧1-a可信区间则为:X 又一力,用或N+ls32例3-2在例3-1中抽得第15号样本的均数 X=166.95(c

11、m),标准差S=3.64(cm),求其总体均数 的95%可信区间。33本例=10,按公式(32)算得样本均数的标准误为C 3.64S-=-=1.1511 x V10(cm)v=-1=10-1=9,双静=0.05,查附表2的t界值表得。5/2,9=2.262。按公式(35)(166.9512.262x l.1511)即(164.35,169.55)cm故该地18岁男生身高均数的95%可信区间 为(164.35,169.55)cm。P25J5号样本34(笏力6。时:按夕A b已知:X 4 正Ua12-。未知但较大:Ua/2x 4 N+%/2。又-ua/2a-,X+ua/2cr-)_4/2 _ Ua

12、/2 即 X-(XUa/2x X-Ua(y-或 X-uaS-(又+ua-或又+uaS-例33某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为L20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。37V本例n=20060,故可采用正态近似的方法按公式(38)计算可信区间。今又=3.64 S=1.20、=200=0.0849,a取双尾0.05得“0.05/2=1.96。(3.64 1.96x0.0849)=(3.47,3.81)(mmol/L)故该地正常成年人血清胆固醇均数的双 侧95%可信区间为(347,3.81)mmoI/Lo382.两总体均数

13、之差的可信区间:从加等,但月不等的两个正态总体N回/)和N(42,)进行随机抽样。则两总体均数之差(“-42)的双侧I可信区间为(XI-X?)ta/2,vXi-X2v-1)+(%-1)=+%239Sk.在为两均数之差的标准误由下式计算Sx.-X2sHi-DSj+g-DS;Z2|+/I2 2s;一合并方差。40同理,两总体均数之差31-2)的单侧1-a可信区间为:.(4-2)(X1-X2)-0_后(从-2)60:X%又或乂%5*1个体值的波动范围正态分布:X a,*偏态分布:PxP100.X用途总体均数的区间估计绝大多数(如95%)观察对象某项指标的分布范围*也可用对应于双尾概率时),*也可用对

14、应于双尾概率时)51第四节t检验52t检验,亦称student t检验,有 下述情况:1、样本均数x与巳知某总体均数比较的检睑 百的:推断一个未知总体均数4与已知总体均 数从是否有差别,用单样本设计。2、两个样采均数照与%比较的微於百的:推断两个未知总体均数 1与2是否有差 别,用成组设计。3、配对设计资料均数比较的检睑百的:推断两个未知总体均数从与人是否有差 别用配对设计。53对于大样本,也可以近似 用U检验54,检验和K检验的应用条件:1检验应用条件:样本含量较小时(如 0或/0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要

15、解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。59 检验水准如 过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取a=0.05o可根据不同研究目的给予不同设置。602.计算检验统计量根据变量和资料类型、设计方 案、统计推断的目的、是否满足特 定条件等(如数据的分布类型)选 择相应的检验统计量。613.确值尸的含义是指从图规定的总体随机抽样,抽得 等于及大于(或/和等于及小于)现有样本获得的检验 统计量(如八等)值的概率。例3-5的P值可用图3-5说明,P为在 片为=140g/L的前

16、提条件下随机抽样,其卜于及等 于2.138和大于及等于2.138的概率o62图35例35中产值示意图63若尸,按所取检验水准a,拒绝名,接受乜,下“有差别”的结论。其统计学依 据是,在/成立的条件下,得到现有检验结 果的概率小于a,因为小概率事件不可能在 一次试验中发生,所以拒绝名。64若是否也能下“无差别叫、或“相等”的结论?不能。正确的说法是按所取检验水准a,接受印 的统计证据不足。其统计学依据是,在区成立的条件 下,如果试验样本少,也同样可以得到尸的检验结 果,我们不知道下“无差别”或“相等”的结论犯错 误的概率有多大,也就是说,假设检验方法不能为我 们提供相信“无差别”结论正确的概率保

17、证。65(one sample/group Z-test)即样本均数x(代表未知总体均数)与 已知总体均数0(一般为理论值、标准值或 经过大量观察所得稳定值等)的比较。其检 验统计量按下式计算v=n-166wr例3-5某医生测量了36名从事铅作业男性班的血 红蛋白含量,算得其均数为130.83g/L,标准差为 25.74g/Lo问从事铅作业工人的血红蛋白是否不同于正 常成年男性平均值140g/L?(1)建立检验假设,确定检验水准Ho:/zo=14Og/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等a,管4=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等

18、a=0.0567(2)计算检验统计量本例=36,X=130.83g/L,S=25.74g/L,Ao=140g/Lo 按公式(3-15)130.83 14025.74/V36二 2.138,=36 1=3568(3)确定产值,作的推断结除以片35 x t=|-2.138|=2.138查附表2的才界 值表,因0.05/2,35 2.138 0.02/2,35,故双尾概 率 0.02(尸(0.05。按a=0.05 7k准,拒绝%,接受”1,有统计学意义。结合本题可认为从 事铅作业的男性工人平均血红蛋白含量低于 正常成年男性。69二、配对/检验(paired/matched t-test)配对t检验适

19、用于配对设计的计量资料。配对设计类型:两同质受试对象分别接受两种不 同的处理;同一受试对象分别接受两种不同处理;同一受试对象(一种)处理前后。du,j d 0 dSd 品二 Sj品I式中,d为每对数据的差值,2为差值的样本均数,%为差值的标准差,邑为差值样本均数的标准误,n为 对子数。70例36为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机 抽取了 10份乳酸饮料制品,分别用脂肪 酸水解法和哥特里罗紫法测定其结果 如表33第(1)(3)栏。问两法测定结果是 否不同?71表33两种方法对乳酸饮料中脂肪含量的测定结果()2.724编号(1)哥特里一罗紫法(2)脂肪酸水解法(3)差值d

20、(4)=(2)-(3)10.8400.5800.26020.5910.5090.08230.6740.5000.17440.6320.3160.31650.6870.3370.35060.9780.5170.46170.7500.4540.29680.7300.5120.21891.2000.9970.203100.8700.5060.36472(1)建立检验假设,确定检验水准H。:为=0,即两种方法的测定结果相同%:即两种方法的测定结果不同a=0.05(2)计算检验统计量本例=10,d=2.724,=0.8483,d=Yd/n=2.724/10=0.2724 Jo.8483-(Z724产/=

21、n=10=0.1087V n-1 10-173按公式(316)0.27240.1087/0=7.925,y=10-l=9(3)确定P值,作出推断结论查附表2的,界值表得PvO.OOL按用0.05水 准,拒绝H。,接受Hj有统计学意义。可认 为两种方法对脂肪含量的测定结果不同,哥 特里一罗紫法测定结果较高。74三、两样率检验(two-sample/group t-test)又称成组/检验,适用于完全随机设计 两样本均数的比较,此时人们关心的是两样 本均数所代表的两总体均数是否不等。两组 完全随机设计是将受试对象完全随机分配到 两个不同处理组。75适用范围:完全随机设计两样本均数的比较 检验方法:

22、依两总体方差是否齐性而定。76L总体方差相等的,检验当两总体方差 相等,即4p;时,可将两样本方差合并,求 两者的共同方差合并方差。(X1-X 2)-(-2)X1-X 2 t=,M 2Sx iX2SxiX2s.网+卜篇T%(;+j77例37为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名口型糖尿病病人进行同期随机对照试验。试验者将这些 病人随机等分到试验组(用阿卡波糖胶囊)和 对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表34,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效 果不同?78表3-4试验组和对照组空腹血糖下降值(mm

23、ol/L)试验组 Xi-0.70-5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10-0.50(尸20)2.50-1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00-1.40对照组 X2 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60-1.10(2=20)6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70-2.0079(1)建立检验假设,确定检验水准-aHo:Hi:肉 2 归0.05_(2)计算检验统计量K=2.0650 mmol/L,标准差=3.0601 m

24、mol/L;X2=2.6250 mmol/L,标准差$2=2.4205 mmol/Lo一 用一京.用一京 一。650-2.6250 _。工组卜.1闾+(%1应+S;/3.06012+2.4i6FV 修+为-2 n n2 n V 20尸 1+22=2(-1)=2(20-1)=3 880确定P值,作出推断结论以片38、=-0.642=0.642,查附表2的界 值表得尸0.50。按方0.05水准,不拒绝印,无 统计学意义。还不能认为阿卡波糖胶囊与拜唐苹 胶囊对空腹血糖的降糖效果不同。81若两总体方差不等(若变量变换后总体方差齐性一可采用 检验(如两样本几何均数的小检验,就是将 原始数据取对数后进行。

25、检验);若变量变换后总体方差仍然不齐一可采用检验或Wilcox on秩和检验。822.Cochran&Cox近似/检验(-检验)匕=4 1%=%12SXiX2a,v2喘+sX2叩+s2a283注意:当小二九2二九时,Vi=V2=K 占C%,v,片-1(不是2-2);用双 尾概率时,儿为4/2,和匕叱取84例38在上述例37国产8类新药阿卡波糖肤囊的降血糖效果研究中,测得用 拜唐革胶囊的对照组20例病人和用阿卡 次糖朕囊的试睑组20例病人,其8周时 糖化血红蛋白HbA(%)下 降值如表35。诃用两种不同药物的病人其HbA下降 值是否不同?85表3-5对照组和试验组HbAlc下降值()分组 X S

26、对照组20 L46 1.36试验组 20 1.13 0.70对照组方差是试验组方差的377倍,经方差齐性检 验,认为两组的总体方差不等,故采用近似上检验。86建立检验假设,确定检验水准(略)计算检验统计量1.46-1.131.362 0.702+20 20=0.965,匕=20 1=19,%=20 1=1987查/界值表 ho-19=2.093。“0.05/21.362200 702 x 2.093+201.362 0.702+20 20 x 2.093=2.093由 f=0.965f0 05/2=2.0930.05。按 a=0.05 水准,不拒绝瓦,无统计学意义。还不能认为 用两种不同药物的

27、病人其HbAlc下降值不同。88r石 I j A Satterinwane 也Cochran&Cox法是对临界值校正而Satterthwaite法则 是对由度校正。八(S;+S;)2 q4 q4X1+dx24 1 7?2 1产(Si%-1S1+)%产)2+叼%189Satterthwaite法对例38做检睑,得z1.362 0.702(+)20 20A.362 z0.70()(20+2020-1 20-1=28.4以v=28.4q28.U0.965查附表2的/界值 表得020尸0.40。结论同前。903.Welch法近似t检验 Welch法也 是对自由度进行校正。校正公式为+S;。v=J1 1

28、-2)X1+)X24+1 a2+1ri2 ri2(5+d2)2nx(Si 4“2-2(J)?+n2+1 n2+191对例3-8,如按Welch法,贝J(1.362/20)2(0.702/20)29-2=29.420+1 20+1以片29.4标29、%=0.965查附表2的/界值表得0.20尸0.40。结论同南。921 0 0三年八月两个大样本均数比较的射佥验公式的讨论推断两个正态总体均数是否不相等,如果两个正态总体方差相等(这里不妨 设n/%),用来自两个总体的两面个样本 均数比较/的检验:X1X?1)+S;(%-1)1+%2%+】)2两个大样本均数比较的济佥验公式的讨论一般认为,如果是两个大

29、样本(比如样本含量均大于50),则可近似用m检验:X X?II I2两个大样本均数比较的冰佥验公式的讨论笔者在教学实践中,试在图1和由很大 的前提下,推导出才,但却推导出:公式(1)变形为:X-X)-LS:(1)+S;(7?2 1)(/%)y ng 珥+22两个大样本均数比较的冰佥验公式的讨论当当叫较大时有:一三.X-X?U B两个大样本均数比较的冰佥验公式的讨论为区别起见,把(3)式的记为小笔者推导出了两个样本方差相差越大或(和)两个样本含量相差越大,和,的差别越大。推导过程如下:两个大样本均数比较的 射佥验公式的讨论令:S;(4l)+s;(%1)JI-ri1+%的2%+4-2于_ S+邑_

30、几2邑+邑多 几2 的2则 产个大样本均数比较的 射佥验公式的讨论工-力=+2一:(1-l)(s;-S;)(4)|弭+2 2%当(口广口2)越大或(和)M-S1越大时,贝打力可越.大,故有:向|越大,一两个大样本均数比较的 冰佥验公式的讨论 并进一步证明了,大样本对小方差(n/%且Si。2),有:tu u.证明过程如下:令:吁=S;+S;=怦;+%,n2%则:两个大样本均坪麒誉等公式的时诒 3(叫+%2)弭电0:.于 u(5)两个大样本直勺于2 于3=2-fl f3 故有:U122 2 r邑 一$2 u u大样本对大方差(口1口2且S/S2),有:tu rU.也就是说,总是较靠近人即t II

31、t U.两个大样本均数比较的冰佥验公式的讨论因此,笔者认为:只有在两个样本方差相 差小和两个样本含量相差小时,才可用检验 代替才检验;而在两个样本方差相差大或(和)两个样本含量相差大时,应该用“检验代替/检 验。否则,将会导致错误的结论。如果仅考虑结果的一致性,检验近似代 替/检验比M检验近似代替/检验,其结果更可靠。第五节假设检检注意事项107一、i型错谍和n型错误假设检睑是利用小概率反证法思想,根 据产值判断结枭,此推新结论具有概率性,因而无论拒绝还是不拒绝M,都可能犯错 凝。见表38。108表38可能发生的两类错误假设检验的结果客观实际-拒绝为“接受”感为成立 I型错误(a)推断正确(1

32、-a)为不成立 推断正确(1-成)II型错误(万)即M成立109I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率 是a(其值等于检验水准)口型错误:“实际有差别,但下了不拒绝外 的结论”,假阴性错误。犯这种错误的概率是6(其值未知)。但n 一定时,a增大,P则减少。1-p:检验效能(power):当两总体确有差 别,按检验水准a所能发现这种差别的能力。110Hr:呼以0 成立一。a界值图36 I型错误与II型错误示意图(以单侧检验为例)in减少I型错误的主要方法:假设检验时设定a值减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合

33、适的样本量:实验设计。112血二、假设检验应注意的问题 1.要有严密的研究设计这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主 要因素(如临床试验用新药和对照药)外,其它 可能影响结果的因素(如年龄、性别、病程、病 情轻重等)在对比组间应相同或相近。保证均衡 性的方法主要是从同质总体中随机抽取样本,或随机分配样本。113 2.不同的资料应选用不同检验方法 应根据分析 目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配 对设计的计量资料采用配对,检验。而完全随机 设计的两样本计量资料,若为小样本(即任一 60)且方差齐,则选用两样本才检验;若方差不 齐,

34、则选用近似/检验(Cochran&Cox法或 Satterthwaite法)。若为大样本(所有60),贝口 可选用大样本检验。114 3.正确理解“显著性”一词的含义 差别 有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参 数或样本统计量之间的比较而言,相应 推断为:可以认为或还不能认为两个或 多个总体参数有差别。115 4.结论不能绝对化因统计结论具有概率 性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列 出检验统计量的值,尽量写出具体的。值或。值的确切范围,如写成。=0.040或 0.02P0.05,而不简单写成P0 为正偏态,/0为尖峭峰,0.5

35、0,偏度 DO.50o 按a=0.10 水 准,不拒绝从无统计学意义。还不能认为这 些样本均数的总体不服从正态分布。130一营开 二”.:J二、两样本方差比较的F检验两小样本/检验时,检查两样本方差代表 的总体方差是否相等(决定上检验的方法)。1.Levene检验2.F检验尸=S:(较大)匕一S;(较小)v2%1%1131数理统计理论证明:当瓦(珑二犬)成立 时,s;/s;服从尸分布。尸分布曲线的形状由 两个参数-二刀1-1和y2=n2-1决定,F的取 值范围为08。图3-10为乙=1、/2=10和 叩5、4二10时方分布的图形。统计学家为应用的方便编制了附表3的F 界值表,表中单尾或单侧的界

36、值用心(表示,双尾或双侧的界值则用心W山表示。132求得尸值后,查尸界值表得尸值(尸值愈 大,值愈小),然后按所取的a水准作出推断 结论。由于第一个样本的方差既可能大于第二 个样本的方差,也可能小于第二个样本的方 差,故两样本方差比较的尸检验是双侧检验。133于F图310不同自由度时方分布的图形134例3,0对例3.7,用R检验判断两总*体空腹血糖下降值的方差是否不等。建立检验假设,确定检验水准H。:crfcr;,Hi:cr;Wcr;,6F0.10计算检验统计量U598,V1=20-1=19,v2=20-1=19135(3)确定P值,作出推断结论以也=19、v2=19查附表3的尸界值表。因 1

37、.5980.10。按0=0.10水准,不拒绝Ho,无统计学意义。还不能认为阿卡波糖 胶囊组与拜唐苹胶囊组空腹血糖下降值的总体方 差不等。故例37采用了方差相等情形的两样本,检验。136三、变量变换实际资料若不满足正态性或/和方差齐性的 假定,尤其当是小样本资料时,这时如用一般 的继验可能会导致偏离真实结果较远。对于明 显偏离上述应用条件的资料,可通过变量变换 的方法加以改善。常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料 性质选择适当的变量变换方法。1371.对数变换r=igxr=ig(i),当原始数据较小或有o时r=1晨不心或了 二ig(4一万对数变换适用于:

38、对数正态分布资料。各样本标准差与均数成比例或变异系数是常 数或接近某一常数的资料。1382.平方根变换 r=4xr=Jx+o.5或vm,当原始数据较小 或有。时平方根变换适用用于:服从Poisson分布 的资料,也即各样本方差与均数成比例者。轻度偏态分布的资料。1393.平方根反正弦变换(1)用角度表示:T二sinM(2)用弧度表示:r=(念)sibA,其 中为圆周率平方根反正弦变换适用于率或百分比的资 料。4.倒数变换r=i/x倒数变换适用于数据两端波动较大的资料。140小结颂彼3螃 霾-数等/卞i工翳 rffltr.:演.y S/TKr-ilh薄漕*运*LL均数的标准误与标准差的区别均数的

39、标准误 标准差_意义 反映X的抽样误差大小 反映一组数据的离散情况bx(Sx)ax=cr/G Sx=S/4n控制方法 增加n以标准误。=s=不能通过统计方法来控制141记法计算2.两均数差别检验的比较:方法前提检验假设计算公式单样本,检验服从正 态分布(),=以0 H、:/d丰氏t=X v=n-l s/M配对,检验差值服从正态分布网:L=aHi:从严。F=,v=n-lSd成组,检验两组数据均 服从正态分布“0:M=2H.。4X-X?t=-,u=g+%一 2S为 _.2大样本也可近似用U检验3.假设检验的步骤及有关概念(1)基本思想:“小概率事件在一次抽样试验中几乎是不可能发生”的原理。(2)步骤:三部曲(3)I类错误、n类错误(4)检验效能(1-/?)143

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服