1、实验5 R绘图(二)一、 实验目的:1. 熟练掌握描述性统计分析中常用的统计量;2. 掌握R语言的高水平作图命令;3. 掌握R语言的低水平作图命令;4. 掌握多元数据的三个数据特征:均值向量、协方差矩阵、相关系数矩阵。二、 实验内容:练习:要求:完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),回答思考题,简要书写实验小结。修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,。如文件名为“1305543109张立1”,表示学号为1305543109的张立同学的第1次实验,注意文件名中没有空格及任何其它
2、字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。截图方法:法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕或“Pr Scrn等字符),即完成截图。再粘贴到word文档的相应位置即可。法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)1. 自行完成教材P130页开始的3。3-3。4节中的例题.2. (习题3。5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下
3、表所示,试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?白鼠试验数据菌型存活天数124324772254256851071212663711667955106310注:平均存活天数其实应该是均值,但当不知道总体的分布时,通常是比较中位数。因此,这里考虑用箱线图中的中位数来进行比较。解:源代码:yc(2,4,3,2,4,7,7,2,2,5,4,5,6,8,5,10,7,12,12,6,6,7,11,6,6,7,9,5,5,10,6,3,10)ffactor(c(rep(1,11),rep(2,10),re
4、p(3,12))plot(f,y)Ac(2,4,3,2,4,7,7,2,2,5,4)B-c(5,6,8,5,10,7,12,12,6,6)C-c(7,11,6,6,7,9,5,5,10,6,3,10)boxplot(A,B,C)运行截图:结论:从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异3. (习题3。6)绘出习题3.16关于3项指标的离散图,从图中分析例3。16的结论的合理性。序号硬度X1变形X2弹性X31654527.62704530。73704831.84694632。65665031。06674631。37684737.08724333.696647
5、33。110684834.2注:1.绘出的图形类似教材P133页的图3。8。2. 把上述表格分复制到记事本中即可实现表格转化为文本,再用read。table()函数存入到数据框中即可,避免输入麻烦。解:源代码: df pairs(df)运行截图:结论:具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系).但从上图可知所有的图中都没有这样的趋势,故均不相关。4. (习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),具体数据如下表所示。(1) 试绘出体重对于身高的散点图;(2) 绘出不同性别情况下,体重与身高的
6、散点图;(coplot(ab|c)(3) 绘出不同年龄段的体重与身高的散点图;(4) 绘出不同性别和不同年龄段的体重与身高的散点图。(coplot(abc+d)学号姓名性别年龄身高体重01AliceF1356。584.002BeckaF1365。398。003GailF1464.390。004KarenF1256.377。005KathyF1259。884.506MaryF1566。5112.007SandyF1151。350。508SharonF1562.5112。509TammyF1462.8102。510AlfredM1469。0112.511DukeM1463。5102.512Guid
7、oM1567。0133。013JamesM1257。383.014JeffreyM1362。584.015JohnM1259。099。516PhilipM1672.0150。017RobertM1264.8128.018ThomasM1157。585。019WilliamM1566.5112。0解:源代码: ef-read.table(file.choose(),header=T);ef attach(ef) plot(体重身高) coplot(体重身高性别) coplot(体重身高年龄) coplot(体重身高年龄+性别)运行截图:5. (习题3.8)画出函数z = x4 2x2y + x2
8、 2xy + 2y2 + 9x/2 4y + 4 在区域 2 x 3,1 y 7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100,共15条。(注:在三维图形中选择合适的角度)解:源代码:xseq(2,3,0。05)yseq(-1,7,0.05)f persp(x,y,z,theta=30,phi=30,expand=0。7,col=lightblue”)运行截图:6. (习题3。9)用Pearson相关检验法检验习题3。7中的身高与体重是否相关。解:源代码
9、:cor。test(身高,体重)运行截图:结论:其P值为7.887e070.05,拒绝原假设,认为变量身高与体重相关.7. (习题3。10)绘出例3.17中48号求职者数据的星图.(数据见文档最后)(1) 以15项自变量FL,APP,SUIT为星图的轴;(2) 以G1,G2,,G5为星图的轴.(提示:先)通过这些星图,能否说明应选哪6名应聘者.为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数.提示:第(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:G1(SC+LC+SMS+DRV+AMB+GSP+POT)/7G2-(FL+EXP+SUIT)/3G
10、3-(LA+HON+KJ)/3G4AAG5 Xread。csv(”applicant。csv) stars(X) attach(X) XG1(SC+LC+SMS+DRV+AMB+GSP+POT)/7XG2 X$G4-AA XG5-APPrtscale(X,17:21)stars(rt)运行截图:思考:1. R语言的高水平作图函数与低水平作图函数的主要区别是什么?所谓高水平函数是与低水平作图函数相对应的,即所有的绘图函数均可产生图形,可以有坐标轴,以及图和坐标轴的说明文字.2. plot()函数除了能画出散点图外,还能画什么图?能画出曲线图吗?曲线图,箱线图;能3. 多元数据主要有哪三个数据特征
11、指标?均值向量、协方差矩阵、相关系数矩阵4. 相关检验的原假设是什么?总体X,Y不相关5. 多元数据的图形表示方法主要有哪几种图?轮廓图,星图,调和曲线图三、 实验小结(必写,但字数不限)本次实验,主要是在星图方面有些阻碍,用不同的函数读取的结果会不一样,有时还读不出来,最终还是把数据存入excel中,才能成功。要学会描述性统计分析中常用的统计量,高水平作图函数与低水平图函数的区别.附:48名应聘者的得分情况IDFLAPPAALASCLCHONSMSEXPDRVAMBGSPPOTKJSUIT1672587883897571029105810991059988810378369897499868
12、104568565928458765568884495855887767776871059658666799888888108108981089998998810910999109997888859898881010471021010710310101093101147100108395910810251247104101078288101037136981054944454768148989638252667561548875410275366461669678989887686101787779586678667818688488643367264196784785442683542048
13、78891052679889213868881053678858229878910101031081081082371079991010399109108249871081010102979910825697745932444454267878548234565562721079891053567645286353535003300502943433000044005030465694103133227331554784103255348332335779103253755233235779103223645234346433811333252356743309010231533698556682224566337496410889139753238496699791210855239106910910101010108101010104010691091010101010101010101041107802120102030010421038011001000000104334982453621333844777698868810886545961097710215578454698101079103157994447071035010002200004806101501000220000