你正在下载：《

R语言试验参考指导书二.doc

》 [预览]

格式：DOC ，页数：12 ，大小：108.54KB ,
资源ID：2990071 下载积分：8 金币

快捷注册下载

登录下载

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

开通VIP

温馨提示：由于个人手机设置不同，如果发现不能下载，请复制以下地址【https://www.zixin.com.cn/docdown/2990071.html】到电脑端继续下载（重复下载【60天内】不扣币）。

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

三方登录：

1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

本文（R语言试验参考指导书二.doc）为本站上传会员【精***】主动上传，咨信网仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知咨信网（发送邮件至1219186828@qq.com、拔打电话4009-655-100或【微信客服】、【 QQ客服】），核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载【60天内】不扣币。【服务填表】

R语言试验参考指导书二.doc

1、 R语言试验指导书（二） 10月27日试验三创建和使用R语言数据集一、试验目标： 1. 了解R语言中数据结构。 2. 熟练掌握她们创建方法，和函数中部分参数使用。 3. 对创建数据结构进行，排序、查找、删除等简单操作。二、试验内容： 1. 向量创建及因子创建和查看有一份来自澳大利亚全部州和行政区20个税务会计师信息样本1 以及她们各自所在地州名。州名为：tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld,

2、sa, tas, sa, nt, wa, vic。 1) 将这些州名以字符串形式保留在state当中。 2) 创建一个为这个向量创建一个因子statef。 3) 使用levels函数查看因子水平。 2. 矩阵和数组。 i. 创建一个4*5数组图，创建一个索引矩阵图，用这个索引矩阵访问数组，观察结果。 3. 将之前state，数组，矩阵合在一起创建一个长度为3列表。 4. 创建一个数据框图。 5. 将这个数据框根据mpg列进行排序。 6. 访问数据框中drat列值为3.90数据。三、试验要求要求学生熟练掌握向量、矩阵、数据框、列表、

3、因子创建和使用。试验四数据导入导出一、试验目标 1. 熟练掌握从部分包中读取数据。 2. 熟练掌握csv文件导入。 3. 创建一个数据框，并导出为csv格式。二、试验内容 1. 创建一个csv文件（内容自定），并用readtable函数导入该文件。 2. 查看R语言自带数据集airquality（纽约1973年5-9月每日空气质量）。 3. 列出airquality前十列，并将这前十列保留到air中。 4. 查看airquality中列对象类型。 5. 查看airquality数据集中各成份名称 6. 将air这个数据框导出为csv格式文件。（write

4、table (x, file ="", sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)）三、试验要求要求学生掌握从包中读取数据，导入csv文件数据，并学会将文件导出。试验五 R语言数据清洗一、试验目标 1. 查看数据集缺失值，并学会对缺失值进行处理。 2. 对异常变量重新赋值。 3. 将某一列字符型转化为日期型。 4. 利用subset（）获取子集。二、试验内容 1. 有一个数据框代码以下，使用summary函数查看，那一列含有缺失值，有多个。并查看wind列最大值。 Ozone <-

5、c(41, 36, 12, 18, NA, 28) Solar.R <- c(190, 118, 149, 313, NA, NA) wind <- c(7.4, 8.0, 12.6, 11.5, 14.3, 14.9) Temp <- c(67, 82, 74, 62, 86, 66) date <- c("1997/05/01","1997/05/02","1997/05/03","1997/05/04","1997/05/05","1997/05/06") air <- data.frame(date,Ozone,Solar.R,wind,Temp, stringsAsFact

6、ors = FALSE) 2. 使用class（）函数查看date函数类型，并将其转化为data型，格式为月/日/年。 3. 使用subset（）依据Temp列获取air中Temp大于60小于70数据。 4. 将air中含有缺失值列去掉。 5. 找出Temp中大于85值将其设置为缺失值。 6. 创建一个air1包含两个列q1，q2。用cbind函数添加到air中。 7. 使用names函数查看air列名，并依据列自己创建一个数据框。使用rbind函数添加到air中三、试验要求要求学生会用subset获取子集，学会对缺失值进行部分简单处理和对部分异常值查找和修改。试验六

7、高级数据管理一、试验目标 1. 学会简单数值和字符处理函数。 2. 学会自己编写一个函数。二、试验内容 1. 使用下面代码创建roster数据集。 Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jones", "Janice Markhammer", "Cheryl Cushing", "Reuven Ytzrhak", "Greg Knox", "Joel England", "Mary Rayburn") Math <-

8、 c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522) Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86) English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18) roster <- data.frame(Student, Math, Science, English, stringsAsFactors=FALSE) 2. 使用length函数查看Student长度。 3. 计算该班级数学平均成绩，最高成绩。 4. 将成绩单

9、根据姓和名进行排序，将学生各科考试成绩组合为单一成绩衡量指标、基于相对名次（前 20%，下20%，等等）给出从A到F评分。 1) 使用quantile函数按20%，40%，60%，80%,求分位数。 2) 使用变量重命名方法将grade列分为A、B、C、D、F多个等级。 3) 使用strsplit 函数将Student列名字分割，存到name中。 4) 创建一个函数x1，功效为实现返回值为传入参数第一个值。 5) 使用sapply 函数将name中firstname提取出来。（“sapply（data，function）”）同理即可提取出lastname。 6) 将lastname

10、和firstname和roster合并，同时去掉roster第一列。 7) 将成绩单用姓和名进行排序。三、试验要求要求学生学会部分简单数值和字符处理函数。学会怎样自己创建一个函数。和对部分简单问题处理。试验七基础统计分析试验一、试验目标 1. 学会使用summary函数和Hmisc包中describe函数来计算统计量。 2. 使用table函数生成一维、二维、多维列联表。 3. 学会用R实现卡方独立性检验。 4. 学会用R进行相关性度量。 5. 学会用R进行Pearson、Spearman和Kendall相关。 6. 学会用R进行相关性显著性检验。 7

11、学会用R进行组间差异非参数检验。二、试验内容 1. 描述性统计分析 1) 对R自带数据集rock（48块石头形态数据）使用summary函数、Himisc包中describe函数、pastecs包中stats.desc函数计算描述性统计量。 2) 使用aggregate、doby中summaryBy对sleep数据集group列分组获取描述性统计量。 2. 频数表和列联表 1) 加载vcd包中Arthritis数据集使用table生成简单频数统计表。 2) 使用table、xtabs对Arthritis生成二维列联表。并使用addmargins为这些表格添加边际和（依据T

12、reatment、Improved）。 3) 使用xtabs，table生成三维列联表（依据Treatment、sex、Improved三个因子）。 4) 使用chisq.testhan()函数对二维表行和列进行卡方独立性检验，并观察她们是否独立。 5) 使用vcd包中assocstats()函数计算二维列联表phi系数、列联络数和Cramer’s V系数。 3. 相关 1) Pearson、Spearman和Kendall相关 a) 对state.x77数据集计算方差和协方差、Pearson积差相关系数、Spearman等级相关系数。 b) 使用psych包中corr.test对state.x77数据集Illiteracy、Murder因子计算相关显著性检验 4. T检验 1) 比较了南方（group 1）和非南方（group 0）各州监禁概率（使用MASS包中t.test独立样本t检验，So因子为是否为南方，Prob因子表示监禁率）。 5. 组间差异非参数检验。 1) 使用Mann–Whitney U检验回复4中相关监禁率问题，。三、试验要求经过此次试验让学生学会基础统计分析用到频数表、列联表、相关、t检验、组间差异分参数检验。让学生能够掌握部分基础统计分析概念和怎样用R来进行统计分析。