ImageVerifierCode 换一换
格式:DOC , 页数:11 ,大小:90.50KB ,
资源ID:6107666      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/6107666.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(stata简单讲义第六讲.doc)为本站上传会员【pc****0】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

stata简单讲义第六讲.doc

1、线性相关和回归 赵耐青 在实际研究中,经常要考察两个指标之间的关系,即:相关性。现以体重与身高的关系为例,分析两个变量之间的相关性。要求身高和体重呈双正态分布,既:在身高和体重平均数的附近的频数较多,远离身高和体重平均数的频数较少。 样本相关系数计算公式(称为Pearson相关系数): (1) 1. 考察随机模拟相关的情况。 显示两个变量相关的散点图程序simur.ado(本教材配套程序,使用见前言)。命令为simur 样本量 总体相关系数 如显示样本量为100,r=0的散点图 本例命令为simur 100 0 如显示样本量为200,r=0.8的散点

2、图 本例命令为simur 200 0.8 如显示样本量为200,r=0.99的散点图 本例命令为simur 200 0.99 如显示样本量为200,r=-0.99的散点图 本例命令为simur 200 -0.99 例1. 测得某地15名正常成年男子的身高x(cm)、体重y(kg)如试计算x和y之间的相关系数r并检验H0:r=0 vs H1: r¹0。 a=0.05 数据格式为 X Y 171.0 58.0 176.0 69.0 175.0 74.0 172.0 68.0 170.0 64.0 173.0 6

3、8.5 168.0 56.0 172.0 54.0 170.0 62.0 172.0 63.0 173.0 67.0 168.0 60.0 171.0 68.0 172.0 76.0 173.0 65.0 Stata命令 pwcorr 变量1 变量2 … 变量m,sig 本例命令 pwcorr x y,sig pwcorr x y,sig | x y -------------+------------------ x | 1.0000

4、 | | y | 0.5994 1.0000 | 0.0182 | Pearson相关系数=0.5994,P值=0.0182<0.05,因此可以认为身高与体重呈正线性相关。 注意:Pearson相关系数又称为线性相关系数并且要求X和Y双正态分布,通常在检查中要求X服从正态分布并且Y服从正态分布。 如果不满足双正态分布时,可以计算Spearman相关系数又称为非参数相关系数。 Spearman相关系数的计算基本思想为:用X和Y的秩代替它们的原始数据,然后代

5、入Pearson相关系数的计算公式并且检验与Pearson相关系数类同。 Stata实现 spearman x y Number of obs = 15 Spearman's rho = 0.6552 Test of Ho: x and y are independent Prob > |t| = 0.0080 stata计算结果与手算的结果一致。结论为身高与体重呈正相关,并且有统计学意义。 直线回归 例2 为了研究3岁至8岁男孩身高与年龄的规律,在某地区在3岁至8岁男孩中随机抽样,共分6个年龄层抽样:3岁,4岁,…,8岁,每个层抽1

6、0个男孩,共抽60个男孩。资料如下: 60个男孩的身高资料如下 年龄 3岁 4岁 5岁 6岁 7岁 8岁 身 高 92.5 96.5 106.0 115.5 125.5 121.5 97.0 101.0 104.0 115.5 117.5 128.5 96.0 105.5 107.0 111.5 118.0 124.0 96.5 102.0 109.5 110.0 117.0 125.5 97.0 105.0 111.0 114.5 122.0 122.5 92.0 99.5 107.5 112.5 11

7、9.0 123.5 96.5 102.0 107.0 116.5 119.0 120.5 91.0 100.0 111.5 110.0 125.5 123.0 96.0 106.5 103.0 114.5 120.5 124.0 99.0 100.0 109.0 110.0 122.0 126.5 平均身高 95.4 101.8 107.6 113.1 120.6 124.0 由于男孩的身高与年龄有关系,不同的年龄组的平均身高是不同的,由平均身高与年龄作图可以发现:年龄与平均身高的点在一条直线附近。 考虑到样本均数存在

8、抽样误差,故有理由认为身高的总体均数与年龄的关系可能是一条直线关系,其中y表示身高,x表示年龄。由于身高的总体均数与年龄有关,所以更正确地标记应为 表示在固定年龄情况下的身高总体均数。 上述公式称为直线回归方程。其中b为回归系数(regression coefficient),或称为斜率(slope);a称为常数项(constant),或称为截距(intercept)。回归系数b表示x变化一个单位y平均变化b个单位。当x和y都是随机的,x、y间呈正相关时b>0,x、y间呈负相关时b<0,x、y间独立时b=0。 一般情况而言,参数a和b是未知的。对于本例而言,不同民族和不同地区,a和b

9、往往是不同的,因此需要进行估计的。由于不同年龄的身高实际观察值应在对应的身高总体均数附近(即:实际观察值与总体均数之间仅存在个体变异的差异),故可以用年龄和实际身高观察值的资料对未知参数a和b进行估计。得到样本估计的回归方程 二、直线回归方程的建立 直线回归分析的Stata实现: 数据结构: x y 3 92.5 3 97 3 96 3 96.5 3 97 3 92 3 96.5 3 91 3 96 3 99 4 96.5 4 101 4 105.5 4 102 4 105 4 99.5 4 102 4 10

10、0 4 106.5 4 100 5 106 5 104 5 107 5 109.5 5 111 5 107.5 5 107 5 111.5 5 103 5 109 6 115.5 6 115.5 6 111.5 6 110 6 114.5 6 112.5 6 116.5 6 110 6 114.5 6 110 7 125.5 7 117.5 7 118 7 117 7 122 7 119 7 119 7 125.5 7 120.5 7 122 8 121.5 8

11、 128.5 8 124 8 125.5 8 122.5 8 123.5 8 120.5 8 123 8 124 8 126.5 多重线性回归命令为 regress 因变量 自变量1 自变量2 ……自变量m 直线回归命令regress 因变量 自变量 本例为 regress y x,得到下列结果: Source | SS df MS Number of obs = 60 -------------+---------------------------

12、 F( 1, 58) = 777.41 Model | 5997.71571 1 5997.71571 Prob > F = 0.0000 Residual | 447.467619 58 7.71495895 R-squared = 0.9306 -------------+------------------------------ Adj R-squared = 0.9294 Total | 6445.

13、18333 59 109.240395 Root MSE = 2.7776 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+----------------------------------------------------------------

14、 x | 5.854286 .2099654 27.88 0.000 5.433994 6.274577 _cons | 78.18476 1.209202 64.66 0.000 75.76428 80.60524 ------------------------------------------------------------------------------ 得到回归系数b=5.854286,常数项a=78.18746,回归系数的检验统计量tb=27.88,P值<0.0001

15、可以认为Y与X呈直线回归关系。 来源 平方和SS 自由度df 均方MS F P值 回归 5997.71571 1 5997.71571 777.41 <0.0001 残差 447.467619 58 7.71495895 合计 6445.18333 59 称为决定系数(本例Stata计算结果R-squared=0.9306),因此0£R2£1,因此残差平方和SSE越小,决定系数R2就越接近1。特别当所有的残差为0时,SSE=0,相应的决定系数R2=1。决定系数R2表示y被x所解释的部分所占的百分比,R2越接近于1说明x对y的解释越充

16、分。 残差=应变量观察值(y)-预测值() Stata的残差计算命令 在输入回归命令regress y x后,再 输入predict e,residual 计算残差并用变量e表示残差 输入 sktest e 残差的正态性检验 输入predict yy 计算预测值。 残差正态性检验(H0:残差正态分布,a=0.05) sktest e Skewness/Kurtosis tests for Normality

17、 ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- e | 0.459 0.441 1.18 0.5534 P值=0.5534>>0.05,可以认为残差呈正态分布。 所建立的回归方程是否有意义,仅凭借假设检验的结论或R2的大小还不能充分说明问题。残差的大小直接反应回归方程的优劣,经常采用图示的方法,以e做纵轴,为横轴作图来考察残差的变化,如果残差比较均匀地散布在e=0的周围,没有明显的散布趋势和明显的离群点,则说明所建回归方程比较理想,否则要借助统计软件做进一步诊断。 graph 残差 预测值 本例 graph e yy 说明残差比较均匀地散布在e=0的周围,没有明显的散布趋势和明显的离群点,故说明所建回归方程比较理想。

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服