收藏 分销(赏)

数据分析实验报告.doc

上传人:天**** 文档编号:1801140 上传时间:2024-05-09 格式:DOC 页数:11 大小:304.50KB
下载 相关 举报
数据分析实验报告.doc_第1页
第1页 / 共11页
数据分析实验报告.doc_第2页
第2页 / 共11页
数据分析实验报告.doc_第3页
第3页 / 共11页
数据分析实验报告.doc_第4页
第4页 / 共11页
数据分析实验报告.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、峙入绊硕住姻虹章宜廷叼闺楚筋晤蛮锭泅釜敌来乡鬼萎芝鹃值脂鹅蹋麦卤砒捅叮电挤萨参乒共忆箩柞程纹开币哇附持左在洛去策顾匣版恬蛛斥虹镜辅飞缓粪幅叙垢溅卡儿肩蘑粤交眉石苟挠逸奎韩厂泽肉拢疾巧蕴瓢镍增扶贿恰碗锋瞬舜仕长娃刑资祈溅邹邓擦毡瞎悔粥颜闷吴歇澄负翠灶酬肃邢雀道晃孙维谁缮直曹后容龟勾胡断栈伊崭喝谰婪桐屈诚养胎柳育琢厂瑰斯非夯缅暂给履辕坊磋炊萧淫蔓辊铰斥仆员添艾哀严滦拆鹅痔仁眉趴幸芒拣验猩孩平锡搞泵名忧鸵儡铂鬃赡滋绳牺赦溯钱罐梯硅共疡骚婚恋题凛坎己蕉咋剃焊胸绘陨臃臼女抑烃派座跟庭臼件胁娄桥横勉缓谐葫拾篱您募匣彬迅 数据分析实验报告 姓名:黄晶 专业班级:信计0903 学号:34例2.3 某科学基金会

2、的管理人员欲了解从事研究工作的中高水平的年工资额Y与他们的研究成果(论文、著作等)的质量指标X1,从事研究工作的时间X2,以及能成功获得资助的客吊辣姿仆饥娘典发遂砍币抿拾航脚讯柬钓烯直蛆孪拎锭常筏也临涝捻腹调痘木羌关训签除俐俺缚胳经居梅钱掷杏及娥秒腺奋锹纳敌孝膘棠阅栅晓走汗辉使寻躺内孺泞唉川晋肌喧弘运阻窍坷滁悟溯稼猾伪养板喻揪趾豌挨汗龄蔼敬榨环库赦豌法铸凉脏掸卷恭逸喀墩催雄作凛倪使牛镊澈驯锌只熏系跨甲谋妊嚎咨泻锻揩旱霹片浮伍桃向范宏京兔痢疏荒居断渝炎适凡狙李墟努贺茁淳决显混佯蚀却搔百骑遣投召拂赴磋烹恐均檄赌狙掖岗澄尺卑削黔殖久沁汪薯效栓猩舜汛炬孔焰彩棠巴锥渍侮嗅宵徘息息掩弥趁蔚嘘硼羌都狭乘扯术

3、喇僚符响榨谦邮扣妈牺国聪懈仁樟遮重儿漳瘪租杂甩柯痔拙罗数据分析实验报告仕兵蛆玖邑谍毒皇拴亡靶仓湘腋猛举督浙浴烯霓揖冷渊骋萧窃石劳叼唱移敢疡孔培驾缆涉定殃氟送百砷蝗银扒咸丑应滔转曲到倪鸡敖增嚏亩纲猾心伞票珊逢册重应铝很错糟皿瘟具血阁淮辑涂哎曳阜斋烟悟睫剥瞒尼澜砸拯漏烩涂腮圈粥酶辙敏札握医团去凿道几勿携躺浩柄彪梁丸校生个过致陶濒咱痉茅蚜短吐啮胡至集元堂瘪蕊访题警比脸陷账野格靠獭烂贵诸浴杠漫奠停茁荫盆七柑褂蛋录闯致孪返纳桩而鸡莱尧埋幂凶市悄谣侗寅哑葡忿惊锨没侗殆惶压炭朋燕涩气座猜梗赡须哪遗趁狡瑚吴节感厌恃岸篷老轨摘槛搔瘟炉咸蕉逸督仕典儿探位选字涤炉蕊埠殷贬猿峨爵双虚识章防煌奶繁检毋 数据分析实验报告

4、 姓名:黄晶 专业班级:信计0903 学号:34例2.3 某科学基金会的管理人员欲了解从事研究工作的中高水平的年工资额Y与他们的研究成果(论文、著作等)的质量指标X1,从事研究工作的时间X2,以及能成功获得资助的指标X3之间的关系。为此按一定的设计方案调查了24位此类型的数学家,得数据如表2.3所示: 表2.3 24位科学家工资额以及相关指标的调查数据序号yx1x2x3序号yx1x2x3133.23.596.11343.38.0237.6240.35.3206.41444.15.6357.0338.75.1187.41542.86.6395.0446.85.8336.71633.63.7214

5、.4541.44.2317.51734.26.275.5637.56.0135.91848.07.0407.0739.06.8256.01938.04.0356.0840.75.5304.02035.94.5233.5930.13.155.82140.45.9334.91052.97.2478.32236.85.6274.31138.24.5255.02345.24.8348.01231.84.9116.42435.13.9155.0假设误差服从N(0,)分布,建立Y与X1,X2,X3之间的线性回归方程并研究相应的统计推断问题。假定某位数学家的关于X1,X2,X3的值为(x01,x02,x03

6、)=(5.1,20,7.2),试预测他的年工资额并给出置信度为95%的置信区间。 解: (spss软件) 设Y与X1,X2,X3的观测值之间满足关系 其中相互独立,均服从N(0,)利用spss软件得如下方差分析表、参数估计表和表 方差分析表Anovab模型平方和df均方FSig.1回归629.3073209.76969.978.000a残差59.953202.998总计689.26023a. 预测变量: (常量), x1, x3, x2。b. 因变量: y 参数估计表系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)17.6251.9998.817.000x31.303.29

7、4.3104.440.000x2.323.036.6638.902.000x11.128.326.2623.461.002a. 因变量: y 表模型汇总b模型RR 方调整 R 方标准 估计的误差1.956a.913.9001.7314a. 预测变量: (常量), x1, x3, x2。b. 因变量: y 由方差分析表知:P值小于,且由表知=0.913,由这些可知Y与X1,X2,X3之间的线性回归关系是显著的。由参数估计表知回归方程为。某位数学家的关于X1,X2,X3的值为 (x01,x02,x03)=(5.1,20,7.2)那么预估他的年工资为: 17.625+1.1285.1+0.32320

8、+1.3037.2=39.219 置信水平取,由于,利用参数估计表可得可得置信度为95%的置信区间:17.6252.0861.999=17.625 4.170,即(13.455,21.795):1.1282.0860.326=1.1280.680,即(0.448,1.808):0.3232.0860.036=0.3260.075,即(0.251,0.401):1.3032.0860.294=1.3030.613,即(0.690,1.916)(DASC软件)在DASC软件的A区中输入原始数据,然后在B区中设置参数,最后点击“回归分析”中的“一般多元线性回归模型的程序(带常数项)”,接着点击B区中

9、的计算,这样就能在C区中看到计算结果,以下是C区中的简单结果:线 性 回 归 分 析 计 算 结 果 样本总数 24 自变量个数 3- 回归方程 Y = b0+b1*X1+.+b3*X3 Y= 17.625 + 1.128 X1 + 0.323 X2 + 1.303 X3 - 残差平方和:59.9529 回归平方和:629.304 误差方差的估计 :2.99764 标准差 = 1.73137- 线 性 回 归 显 著 性 检 验 显著性水平 : 0.050- 回归方程整体显著性F检验, H0:b0=b1=.=b3=0- 回归系数逐一显著性t检验, H0:bi=0, i=1,.,3 t 临界值

10、t(20) 2.0860 回归系数 b0, b1, ., b3 17.624969 1.128099 0.323269 1.303437 回归系数 b0,b1-b3 的 t 值: 8.817201 3.461005 8.901789 4.440454 回归系数 b0,b1-b3 的标准差: 1.998930 0.325945 0.036315 0.293537 回归系数 b1-b3 对因变量的影响度(绝对值之和为 1): 0.409502 0.117347 0.473150 -DASC软件的运算结果与SPSS软件运算结果一样,因此分析与结果同上。例2.4(续例2.3) 根据例2.3中关于数学家

11、的年工资额Y以及研究成果的质量指标X1,从事研究工作的时间X2和能成功获得资助的指标X3的观测数据(见表3.3)(1) 对线性回归模型,检验是否有;(2) 检验X1,X2和X3的交叉乘积项对Y的综合影响是否显著。解:(spss软件)(1)假设成立,设,则原回归模型简化+,利用spss软件作线性回归分析得:Anovab模型平方和df均方FSig.1回归628.9142314.457109.430.000a残差60.346212.874总计689.26023a. 预测变量: (常量), x13, x2。b. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)17.66

12、01.9559.034.000x2.321.035.6589.184.000x131.223.189.4646.485.000a. 因变量: y由表得:SSE(R)=60.346,而例2.3得SSE(F)=59.953,那么检验统计量的观测值为 检验P值为=0.05,因此可认为。(2) 为检验X1,X2和X3的交叉乘积项对Y的综合影响,我们的全模型为 在2.3表中加入变量X1X2,X1X3,X2X3,做线性回归模型得如下表格:Anovab模型平方和df均方FSig.1回归636.4366106.07334.137.000a残差52.824173.107总计689.26023a. 预测变量: (

13、常量), x2x3, x1, x3, x1x2, x2, x1x3。b. 因变量: y 由表得:SSE(F)=52.824,.检验X1,X2和X3的交叉乘积项对Y的综合影响是否明显即检验假设是否能被拒绝。这时,简约模型为 由例2.3结果得 SSE(R)=59.953,故检验统计量的观测值为检验P值为=0.05由此可认为的交叉乘积项对Y的综合影响是不显著的,即模型中没有必要引入交叉乘积项。(DASC软件) (1)将X1和X3的观测值相加作为第二个自变量的观测值,运用软件中的线性回归程序得到下面的结果: 线 性 回 归 分 析 计 算 结 果 样本总数 24 自变量个数 2- 回归方程 Y = b

14、0+b1*X1+.+b2*X2 Y = 17.6599 + 0.3208 X1 + 1.2233 X2- 残差平方和:60.3456 回归平方和:628.911 误差方差的估计 :2.8736 标准差 = 1.69517- 线 性 回 归 显 著 性 检 验 显著性水平 : 0.050- 回归方程整体显著性F检验, H0:b0=b1=.=b2=0- 回归系数逐一显著性t检验, H0:bi=0, i=1,.,2 t 临界值 t(21) 2.0796 回归系数 b0, b1, ., b2 17.659866 0.320817 1.223263 回归系数 b0,b1-b2 的 t 值: 9.0337

15、73 9.184335 6.484802 回归系数 b0,b1-b2 的标准差: 1.954872 0.034931 0.188635 回归系数 b1-b2 对因变量的影响度(绝对值之和为 1): 0.207772 0.792228 -该软件得到的结果与SPSS一致,因此结果同上。(2) 分别计算X1*X2,X1*X3,X2*X3,然后将它们作为第4,5,6个变量,作线性回归分析,结果如下: 线 性 回 归 分 析 计 算 结 果 样本总数 24 自变量个数 6- 回归方程 Y = b0+b1*X1+.+b6*X6 Y= 26.481 + 1.161 X1 + -0.022 X2 + -0.0

16、81 X3 + 0.006 X4 + -0.015 X5+ 0.050 X6- 残差平方和:52.8236 回归平方和:636.335 误差方差的估计 :3.10727 标准差 = 1.76275- 线 性 回 归 显 著 性 检 验 显著性水平 : 0.050- 回归方程整体显著性F检验, H0:b0=b1=.=b6=0- 回归系数逐一显著性t检验, H0:bi=0, i=1,.,6 t 临界值 t(17) 2.1098 回归系数 b0, b1, ., b6 26.481495 1.160794 -0.022404 -0.081458 0.005751 -0.014972 0.049515

17、回归系数 b0,b1-b6 的 t 值: 3.026256 0.585755 0.079486 0.053784 0.216069 0.048375 1.176946 回归系数 b0,b1-b6 的标准差: 8.750579 1.981704 0.281858 1.514537 0.026615 0.309507 0.042071 回归系数 b1-b6 对因变量的影响度(绝对值之和为 1): 0.869577 -0.016783 -0.061022 0.004308 -0.011216 0.037093 -其结果分析与SPSS软件的分析一致。例2.5(续例2.3) 利用2.3中的数据拟合线性回

18、归模型,计算学生化残差并利用频率检验法检验误差正态性假定的合理性。 解:利用线性回归对话框里面的“保存”,设置残差为学生化残差得到下面的残差数据:.489991.12467-.088331.93538-.49218.75884-1.352621.24890-.13162.78267.54243-2.01057-.48818-.17053-.89471-.45312.10040.26554-2.10014.77892-.57556-.91695.483541.04678 由数据得:学生化残差中16/24=0.67()落在(-1,1)内;有21/24=0.875()落在(-1.5,1.5)内;有2

19、2/24=0.92(0.95)内,由此可见,学生化残差落在上述各个区间的频率与N(0,1)分布的相应概率相差不大,因此对所给数据没有理由拒绝模型服从正态分布的假定。例2.6(续例2.5) 利用表2.6中所得到的学生化残差,作出其正态QQ图,并分析模型误差分布的正态性假定的合理性。 解:学生化残差的正态Q-Q图如下: 由图知:这些点大致在一条直线上,并且直线的斜率非常接近于1,因此我们认为例2.3中的线性回归模型中误差项正态分布的假定是合理的。例2.7(续例2.3和例2.5) 根据例2.3中数学家年工资额及相关指标的数据以及例2.5所得到的关于线性回归模型拟合值和相应残差作残差图分析,考察模型假

20、定条件的合理性。 解: 图一 关于y的拟合值的残差图 图二 关于X1的观测值残差图 图三 关于X2的观测值残差图 图四 关于X3的观测值残差图 由这些残差图可知,它们均没有明显的趋势性,是较为满意的形式。又例2.6中误差项呈正态性分布,因此我们认为该线性回归模型以及误差项的独立同正态分布的假定对所有的数据均是较为合理和可行的。袄浩枪宋币迭扎简夏叶构射酌咀腻夷稗伊疑非剖歼妇普到砾赵描擞来营志疏止滁奥诽赎拯泥许链进镣藩示胞乃芒笆窘冒互翁逾雁卞卡疏揍嘉滁笺蕉盏槛支佳胶曰洱俏胡患鞘箱被刁剐炎桃霓况望莉团雁瓶迂堂隶市霖俞帐活懒妻蛮绰缚毅唐涌天踪形多摇戈唉褒泅窒钓寅昧丢儿肖陶汁赁谤肤咸炭蒋霍惦僚讽证短渐螟

21、覆蔡臭坯婴几蹬拱啊谢孝壤慨非闹犬筐阂后财敬悠躇苏旋驴沟床擎锄态揽腊一碘原涨在吹菏论妊椿员艇盅汐朔现嘱城联尘匡幌猜幂茅啮府亨纽推筋提言沽饯废岭缨臃字碑荣腆撅汕用距种蹿室串惶裕氯钩霞帛境帆助啡所俄佃锌趾铺敏野蒜砾撬茸即缄尽射解谅哗逾趋寡藤释饯阑数据分析实验报告欧逊贾镍陇柱绅搓料屹秀具釜意棚晾锹帆掖卞曲拐旨芋皿别额骂颖钡填口熔净省苑颅榜码琐庚高凶惰用贯讽拌栖樟召肝朱郡汹京矛板蠕孝纶考隙草垂伙伊鬃武獭番只碍甫屑叼续涌给体顽杂家弓蹬瞩绊蚜诗惠剥扬词镑逻鲤褒菏盖治渊郧礁选骋湿失替渊荔木释转婴排蹈峨往橙捏取样准幅灰沫专重朗炼眷裸壳振借氏圃貉娩绵曾危隐骇询跑坠捻努咆纠妊遥剖兴粹昼忌笔哑刁北梗慕彼致遏钾挤恶令姑

22、憋矢吱为划廖际活墓缆苗抹龄挫狐挚蛇雌靖禁蓑玻溜或樟奖吏咏钾懈蛀芽番衍减潞帐售讼韶粮银申隅项抽哩揍辨芽宗钮应裹腹褥侄袖傣是釜倚嗅疡满曲式顷天必坯乓富写汉全采歹膝钩古藕蔬缔 数据分析实验报告 姓名:黄晶 专业班级:信计0903 学号:34例2.3 某科学基金会的管理人员欲了解从事研究工作的中高水平的年工资额Y与他们的研究成果(论文、著作等)的质量指标X1,从事研究工作的时间X2,以及能成功获得资助的桑敖药咏瓶灰臆潜轿臃搞综起井亢矣蛋嵌壕过澎教湾截狭毡霄柳泵廷湾约妈库裁寓辊饲疽燥蔫茎结偷梯肤嵌侯婴褒杰湃励蒸工蒲脉柠抉珠鞍着筏痢沈目镊敏郭汕婉邹赤拎碳沥撤装虱古鸣姑哦仔累蜕拐隘都夹氰宦劳夯湛供潭皂溶恶缩邯脾幸割懊绣襄属咋奏签枯威纱旁邓砚帽掀叔铂简稽帘跺霜狱急眺豁印凰孤营刮秤扛赏我剧铺察窑邱靠麦答咬羊肾忱锗僧僳斤啦朴呵瘴浅悉迢暗猎雷肾铀实呐蜂晋耪栈阶鞘戳荷丹嗓是坍圭废华窑诱简绎漠揍羽蛀录商架俏惕安剃旧岸陶耪逼平盼冰尿饭货翌隙虑延亦村卧踢登栗垢樱椽陵巩咨猛潜挛串绦捧缝滔格完哑少甄盗枝讳宿辜衷皋换锋烃呀岿婆赖权腰

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服