收藏 分销(赏)

医学统计学Ch15-王一任.ppt

上传人:精*** 文档编号:12683826 上传时间:2025-11-24 格式:PPT 页数:46 大小:876KB 下载积分:12 金币
下载 相关 举报
医学统计学Ch15-王一任.ppt_第1页
第1页 / 共46页
医学统计学Ch15-王一任.ppt_第2页
第2页 / 共46页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,讲述内容,第一节 多元线性回归,第二节 自变量选择方法,第三节 多元线性回归的应用,及其注意事项,目的,:作出以多个自变量估计应变量的多元线性回归方程。,资料,:应变量为定量指标;自变量全部或大部分为定量指标,若有少数定性或等级指标需作转换。,用途,:解释和预报。,意义,:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。,第一节,多元线性回归,一般步骤,建立回归方程,(2)检验并评价回归方程,及各自变量的作用大小,二、多元线性回归方程的建立,例15-1,27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。,表,15-2,27名糖尿病人的血糖及有关变量的测量结果,求偏导数,原 理,最小二乘法,三、假设检验及其评价,1.方差分析法:,(一),对回归方程,表,15-4,例,15-1,的方差分析表,表,15-3,多元线性回归方差分析表,2.决定系数,R,2,:,3.复相关系数,(二)对各自变量,指明方程中的每一个自变量对,Y,的影响(而方差分析和决定系数检验整体)。,1.偏回归平方和,表15-5 对例15-1数据作回归分析的部分中间结果,各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到,表15-5给出了例15-1数据分析的部分中间结果。,结,果,结 论,2.,t,检验法,是一种与偏回归平方和检验完全等价的一种方法。计算公式为,结 果,结 论,3,标准化回归系数,变量标准化是,将原始数据减去相应变量的均数,然后再除以该变量的标准差。,计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数,。,(没有 ),注意:,一般回归系数,有单位,用来解释各自变量对应变量的影响,表示在其他自变量保持不变时,增加或减少一个单位时,Y,的平均变化量。不能用各 来比较各 对 的影响大小。,标准化回归系数,无单位,用来比较各自变量对应变量的影响大小,越大,对,的影响越大。,结,论,第二节,自变量选择方法,目的,:,使得预报和(或)解释效果好,一、全局择优法,目的,:预报效果好,意义,:对自变量各种不同的组合所建立,的回归方程进行比较,择优,。,选择方法:,例,15-2,用全局择优法对例,15-1,数据的自变量进行选择。,二、,逐步选择法,1.,目的:,解释效果好,意义:,选择对应变量作用显著的自变量,选择方法:,1.,1.前进法,,回归方程中的自变量从无到有、从少到多逐个引入回归方程。此法已基本淘汰。,2.,后退法,,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。,剔除自变量的方法是在方程中选一个偏回归平方和最小的自变量,作,F,检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。,3.逐步回归法,,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。,表,15-7,逐步回归过程,表15-8 例15-3方差分析表,“最优”回归方程为,结果表明:血糖的变化与甘油三脂、胰岛素和糖化血红蛋白有线性回归关系,其中与胰岛素负相关。由标准化回归系数看出,糖化血红蛋白对空腹血糖的影响最大。,表15-9 例15-3的回归系数的估计及检验结果,第三节,多元线性回归的应用及其注意事项,一、多元线性回归的应用,二、多元线性回归应用的注意事项,1指标的数量化,分,2,类,可用一个(,0,,,1,)变量。如性别,分,k,类,,k-1,个(,0,,,1,)变量,如血型。,数据格式,回归方程,建立回归方程,b,1,:,相当A 型相对于O 型的差别,b,2,:相当B 型相对于O 型的差别,b,3,:相当AB 型相对于O 型的差别,(3)等级,定量。,一般是将等级从弱到强转换为 (或,)如文化程度分为小学、中学、大学、,大学以上四个等级。,Y,为经济收入。,解释:,b(b,1,),反映,X(X,1,),增加1个单位,,增加,b,个单位(如:500元)。表示中学文化较小学收入多500,,大学较中学多500,余类推。,b,1,b,2,b,3,分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小,也可将K个等级转换为K-1个(0,1)变量,2样本含量:,n,=(510),m,。,3,关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例,15-3,中若将选入标准和剔除标准定为 和 ,选入的变量是 ,而不是 ,结果发生了改变。,不同回归方程适应于不同用途,依专业知识定。,4,.多重共线性,即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果:,(1)参数估计值的标准误变得很大,从而,t,值变得很小。,(2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。,(3),t,检验不准确,误将应保留在模型中的重要变量舍弃。,(4)估计值的正负符号与客观实际不一致。,消除多重共线性,:,剔除某个造成共线性的自变量,重建回归方程;合并自变量;,采用逐步回归方法,。,谢谢大家!,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服