收藏 分销(赏)

《数据分析基础—Python实现》—各章习题答案.pdf

上传人:曲**** 文档编号:225496 上传时间:2023-03-08 格式:PDF 页数:27 大小:1.72MB
下载 相关 举报
《数据分析基础—Python实现》—各章习题答案.pdf_第1页
第1页 / 共27页
《数据分析基础—Python实现》—各章习题答案.pdf_第2页
第2页 / 共27页
《数据分析基础—Python实现》—各章习题答案.pdf_第3页
第3页 / 共27页
《数据分析基础—Python实现》—各章习题答案.pdf_第4页
第4页 / 共27页
《数据分析基础—Python实现》—各章习题答案.pdf_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现贾俊平著数据分析基础一Python实现#各章习题答案#说明:1.本答案仅供参考。2.本答案主要给出结果,读者可参考教材内容自行进行详细分析。暑楣卷材数据分析基础 py-hon实现 贾俊平等 a中同食大版社1/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第1章 数据分析与Python语言1.1 (4)数值变量。类别变量。数值变量。有序类别变量。无序类别变量。1.2(1)总体是“所有IT从业者”,样本是所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3

2、)无序类别变量。1.3(1)总体是“所有的网上购物者。(2)无序类别变量。1.4(1)分层抽样。(2)100oL5(略)。2/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第2章Python数据处理2.1(1)按姓名(拼音字母)升序排序如下:姓名 统计学 数学营销学管理学会计学1程建功68858489865房文英78845160609高见岭63709185828洪天利58517991857宋丽媛801005373702田思雨74746180696王智强90785972663徐丽娜881004971664张志杰63828978800赵宇翔85916376

3、66(2)统计学分数小于 姓名8 洪天利60的学生如下:统计学 58数学51营销学79管理学 91会计学85数学分数大于等于90 姓名0 赵宇翔3 徐丽娜7 宋丽媛的学生如下:统计学858880数学91100100营销学 63 49 53管理学 7671 73会计学6666702.2(1)被调查者性别和满意度的简单频数分布表如下:性别的简单频数表女 33男 27Name:性别,dtype:int 64满意度的简单频数表比较满意 一般 不满意 非常不满意 非常满意161312109Name:满意度,dtype:int 643/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础

4、一Python实现(2)被调查者性别和满意度的二维列联表如下:满意度 性别女男 合计一般:8513F满意7512比较满意7916非常不满意6410非常满意549合计332760(3)百分比表如下(读者自己分析):#各行占行合计百分比表满意度一般不满意比较满意非常不满意非常满意性别女24.2421.2121.2118.1815.15男18.5218.5233.3314.8114.81合计21.6720.0026.6716.6715.00#各列占列合计百分比表满意度一般不满意比较满意非常不满意非常满意合计性别女61.5458.3343.7560.055.5655.0男38.4641.6756.25

5、40.044.4445.0#各数据占总和百分比表满意度一般不满意比较满意非常不满意非常满意合计性别女13.3311.6711.6710.008.3355.0男8.338.3315.006.676.6745.0合计21.6720.0026.6716.6715.00100.02.3灯泡使用寿命频数分布表如下(组距=ioo)4/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现使用寿命的分布接近对称分布,且主要集中在69007000小数之间,为20只,占使用寿命分组频数频数百分比(%)累积频数累积频数百分比(%)6500,6600)22.022.06600,67

6、00)55.077.06700,6800)66.01313.06800,6900)1414.02727.06900,7000)2626.05353.07000,7100)1818.07171.07100,7200)1313.08484.07200,7300)1010.09494.07300,7400)33.09797.07400,7500)33.0100100.0总数的26%o2.4#无放回抽取5个地区:宁夏回族自治区丁河北省上海市丁山西省辽宁省#有放回抽取5个地区:r内蒙古自治区安徽省福建省安徽省云南省2.5set.seed(20)#标准正态分布:-0.31232848 0.33928471

7、-0.15590853-0.50178967 0.23556889-1.76360526-1.09586204-1.08776574-0.30517005-0.47374837-0.20059454 0.355196770.68951772 0.41058968-0.56497844 0.59939069-0.16293631 1.60021450.6816272 0.0148801#值为100、标准差为20的正态分布:98.24440736 80.35764319 102.43380957 77.25125428 106.9800515662.8297367963.7650946690.20

8、530578112.0637087776.6563622870.033855899.9894298780.03595844128.33548962 84.34782084#1000之间的均匀分布:520.97597833 684.88447386128.497936670.9971356490.19494766124.3008310294.99358606425.865005129.93130725125.7986411166.12186077 104.5452805584.1358115786.64967017140.9779752794.5498844693.83371077 134.59

9、37606 603.86958425 824.02525935452.41939218918.02345725875.79027614743.67620984202.16524457574.17793488363.92750723621.99871374888.05725583 636.92964801 128.4645628 330.685170092.643113880.493008615.98915219936.32619381221.17913714220.5422753304.35008605608.2444550772.66146354201.51924634899.8276814

10、599.44063173107.71582907548.00488121296.00127513516.1596778421.07400202421.75688121615.78476675140.139436612.9981155 920.87887068 569.5359326 919.8809239 499.41845448 932.3450662 970.97112624 678.696348525/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现546.79270829 10.03533915 774.99546968 122.30308037

11、 517.876748432.6录入数据的结果如下:收入户等级2017 年2018 年2019 年2020 年2021 年0低收入户3750464765458004104221中等偏下户733893301267417024216362中等收入户10508135061827724832316853中等偏上户14823194042604435576456394高收入户28225369574917567132855416/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第3章 数据可视化分析3.1(1)各图形如下7/27新编21世纪高等职业教育精品教材-智慧财

12、经系列贾俊平著数据分析基础一Python实现东部地区满意度的帕累托图ao601004020140-120-100-90f 非鬻满点 比较满意 不满意 非常不满总满意度东部地区满意度的瀑布图S0R605040 一 8/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现东部地区满意度的漏斗图,也交满意,非满短一股 不满意,非常不;统东部地区满意度的饼图(2)各图形如下:9/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现满意度(b)东部地区和西部地区满意度的堆积条形图东部 西部满意度10/27新编21世纪高等职业教育精品

13、教材-智慧财经系列贾俊平著数据分析基础一Python实现东部地区和西部地区满目度的环形图(3)百分比条形图如下1-0.50-0.25-0.75-中部地区西部满意度非常满意J比较满意 一般不满意|非常不满意0-东玩(4)树状图如下:11/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现(5)雷达图和轮廓图如下:12/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现3.2(1)直方图如下:(2)箱形图如下13/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现180-175-170

14、-矩本 165-160-155-150-子女身离父亲身高 糊母亲身高(3)散点图如下(a)子女身高与父亲身高的点图182.5-180 0-177.5-0 5 0 175.172.170.167 5-165 0-162 5.155 160 165 170 175 180子女身高匝注胀酎(b)子女身高与母亲身高的散点图(4)气泡图如下:14/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现167.5-512.07 5 Z。1&1&16朽1&朽 俗气泡图:气泡大小:子女身高162 5 165 0 167.5 170.0 172.5 175.0 177.5 18

15、0.0 182.5父亲身高175170165160155 一 一 一 一 一 Irt1803.3折线图和面积图如下:#折线图折线图106104102100死出2012#面积图2014 20162018202015/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现2001751501251007550252012 2014 2016 2018 202016/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第4章 数据的描述分析4.1(1)各统计量如下:平均数=24.8中位数=24.45四分位数=22,75 26.8

16、75第80个百分位数=27.3众数0 22.71 22.92 25.03 25.94 27.3dtype:flo at64(2)各统计量如下:极差=12.7四分位差=4.125方差=8.6845标准差=2.9469(3)偏度系数和峰度系数如下:偏度系数=0.2708峰度系数=-0.0243(4)标准分数如下:标准分数-2.1729e+00 9.1510e-01 6.6700e-02-5.1010e-01-8.8 340e-01 2.1367e+008.4720e-01-2.3870e-01-6.1190e-018.4720e-01-1.1000e-03-6.459 0e-01-1.5960e+

17、00-9.5130e-014.7390e-01-3.4050e-013.7210e-011.3460e-013.7210e-017.7930e-01-2.7260e-011.8991e+00-6.459 0e-01-7.8 160e-01-7.1370e-016.6700e-02-8.1550e-011.5259e+001.4580e+00-7.1370e-014.2结果如下:加权平均数=4266.6667加权标准差=1164.8445(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数”女=。=0.10男生体重的离散系数“男=总=0.08。所以女生的体重差异大。(2)假定体

18、重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大 约为68%o因此,男生中大约有68%的人体重在55kg至65kg之间。(3)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大17/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现约为95%O因此,女生中大约有95%的人体重在40kg至60kg之间。4.4通过计算标准分数来判断:_%A-又 A_1_%b-又 B_425-400_ZAfn,-二1;ZBF-=F=。.5该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5 个标准差,由于A

19、项测试的标准分数高于B项测试,所以A项测试比较理想。4.5主要描述统计量如下:方法A 方法B 方法C平均数 标准差离散系数165.6 2.1314 0.0129128.7333 1.7512 0.0136125.5333 2.774 0.0221从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他 两种方法。从离散程度来看,三种方法的离散系数分别为:C4=0.0129,CVB=0.0136,CVc=0.0221c方法A的离散程度最小。因此应选择方法Ao4.6主要描述统计量如下运动员(分析由读者完成):标准差极差离散系数偏度系数n平均数中位数亚历山大彼得里夫利2010.010

20、10.150.53102.40.053051-1.659957克里斯蒂安赖茨2010,01510.200.72132.90.072023-1.529250列昂尼德叶基莫夫209.86010.000.52951.90.053707-0.452631基思桑德森209.6809.800.56062.40.057917-1.108916拉尔夫许曼2010.02510.150.57942.50.057792-1.013906罗曼邦达鲁克209.7359.850.8 6163.70.088508-1.50288318/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现

21、第5章 推断分析基本方法5.1(1)各概率如下:P(X2510)=0.308538P(400WXW450)=0.006209(2)各概率如下:P(0WXW1.2)=0.38493P(-0.48 WXW0)=0.184386P(X2L2)=0.11507(3)q(0.95)=1.6448545.2(1)P(XWT.5,df=15)=0.077183(2)P(X22,df=20)=0.029633(3)q(P=0.95,df=30)=1.6972615.3(1)Ho:45,%:45。(2)拒绝原假设时,结论为:每100ml中维生素C的含量 45mg。(3)不拒绝原假设时,结论为:没有证据表明每10

22、0ml中维生素C的含量不2 45mg。5.4(1)95%置信区间为:55.5564 66.6436。(2)90%置信区间为:57.1789,65.0211.5.5(1)PM2.5 均值的 95%的置信区间:74.943,81.307。(2)提出假设%:之82;匕:V 82。检验统计量=238685,p值=0.008497。拒绝原假设,可以认为该城市空气PM2.5的 平均值显著低于过去的平均值。5.6(1)95%的置信区间:24.4835,26.5365。(2)%:=25,%:W 25。假设总体方差为 5kg:z=0.456158,P=0.648276。假 设总体方差未知:L 039 9,P=0

23、3114。两种情况均不拒绝仇,没有证据表明该企业 生产的金属板不符合要求。5.7已知:几=50,p=0.64,a=0Q5,Zoq5/2=L9 6。总体中赞成该项改革的户数比 例的95%的置信区间为:0.507 0.773o19/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现5.8Ho:TI 17o z=2.44058 3,P=0.00733178,拒绝%,该生产商的说法 属实。20/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第6章相关与回归分析162 5 165 0 167.5 170.0 172 5 17

24、5.0 身高从散点图可以看出,身高与体重之间为正的线性相关关系。(2)r=0.980292。高度线性相关。6.2(1)回归方程为:y=430.18 9 2-4.7006xo回归系数庆=4.7006表示航班正点率 每增加1%,顾客投诉次数平均下降4.7006次。(2)回归系数检验的P=0.001 a=0.05,拒绝原假设,回归系数显著。(3)80=430.18 9 2-4.7006 X 80=54.1412次(精确预测值=54.139 422)。6.3 (4)回归方程:y=200.0564+6.6453%o腔=9 7.16%,拟合程度较高。P=1.9 39 E-11,回归模型显著。92oo=15

25、29.1259 11o残差和标准化残差如下:Obs Dep Var Population Predicted Value Residual Std Error Residual21/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现012145.68-24.6817.01125870.12-12.1217.9238570.1214.8817.9346874.35-6.3517.92457483.28-9.2817.81569390.82.217.58677295.5-23.517.367812297.3924.6117.2689180.5517.4510.

26、2910125108.216.816.5残差图如下:残差图显示模型基本上合理o22/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现第7章时间序列分析7.1照理杷至胭其QEQis(1)2021年简单指数平滑法预测(a=0.3)结果:102.365612。(2)预测值与拟合值的图形图如下:居民消费价格指数的简单指数平滑预测106-105-104-103-102-101-100-99-2005 2010 2015 2020时间(3)预测的残差图如下:23/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现简单指数平滑预测

27、的残差图2001 2004 2007 2010 2013 2016 2019时间7.2(i)环比增长率和定基如下:年份国内生产总值环比增长率()定基增长率()02011487940.2NaN01201253858010.3810.3822013592963.210.121.5232014643563.18.5331.8942015688858.27.0441.1852016746395.18.3552.9762017832035.911.4770.5272018919281.110.4988.482019986515.27.31102.18920201015986.22.99108.22年平均

28、增长率:G=8.49 04%o(2)C021=1083295.3o24/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现1e6 国内生产总值一元线性回归预测1.1 1.0-0.9-Q8-Q.7-Q6-Q5-2011 2014 2017 2020年份(3)残差图如下:国内生产总值一元线性回归预测的残差图20000-10000-I 0-10000-20000-30000-2011 2014 2017 2020时间7.3(1)二阶曲线和三阶曲线及其预测结果如下:二阶曲线:Y=34.69 52-0.1661t+0.0031t2三阶曲线:Y=33,8 69 8+0

29、.09 11t-0.0146/+0.0003t3o25/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现预测值和预测误差如下:时间1收盘价33.82二阶曲线二阶曲线三阶曲线三阶曲线预测值 34.532237预测残差-0.712237预测值 33.946757预测残差-0.126757233.6434.375366-0.73536633.996526-0.356526334.0034.224616-0.22461634.021107-0.021107434.0934.0799860.01001434.0224560.067544534.2733.94147

30、70.32852334.0025300.267470634.2733.8090890.46091133.9632860.306714734.0033.6828220.31717833.9 0668 10.093319833.8233.5626750.25732533.834672-0.014672933.9133.4486490.46135133.7492160.1607841033.8233.3407430.47925733.6522680.1677321133.5533.2389590.31104133.5457870.0042131233.3633.1432950.21670533.43

31、1729-0.0717291333.3633.0537510.30624933.3120510.0479 491433.1832.9703290.20967133.188709-0.0087091533.0032.89 30270.10697333.063661-0.0636611632.6432.821845-0.18184532.938863-0.2988631732.5532.756785-0.20678532.816272-0.2662721832.6432.697845-0.05784532.697845-0.0578451932.7332.6450260.08497432.5855

32、380.1444622032.4532.59 8327-0.14832732.481310-0.0313102132.3632.557749-0.19774932.387115-0.0271152232.0032.523292-0.52329232.3049 11-0.3049 112331.6432.494956-0.8549 5632.236656-0.5966562432.0932.472740-0.38274032.184305-0.0943052532.3632.456645-0.09664532.1498160.2101842632.3632.446670-0.08667032.1

33、351450.2248 552732.3632.442817-0.08281732.1422500.2177502832.6432.4450840.19491632.1730860.4669 142932.7332.4534710.27652932.2296120.5003883032.4532.467980-0.0179 8032.3137830.1362173132.4532.488609-0.03860932.4275560.0224443232.2732.515359-0.24535932.572889-0.3028893332.3632.548229-0.18822932.75173

34、8-0.3917383433.0032.5872200.41278032.9660600.0339 403533.1832.6323320.54766833.217811-0.03781136NaN32.683565NaN33.50895NaN预测图如下图所示:26/27新编21世纪高等职业教育精品教材-智慧财经系列贾俊平著数据分析基础一Python实现二阶曲线和三阶曲线预测残差图如下:二阶曲线和三阶曲线预测残差 二阶曲埃颈期残差.三鼾曲改预测残差1 4 7 10 13 16 19 22 25 28 31 34时间从不同趋势方程的预测图和残差图均也可以看出,三阶曲线与原序列的拟合最好。27/27

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 研究报告 > 年鉴/数据分析

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服