收藏 分销(赏)

R语言与统计分析.pptx

上传人:w****g 文档编号:4840524 上传时间:2024-10-14 格式:PPTX 页数:36 大小:1.11MB
下载 相关 举报
R语言与统计分析.pptx_第1页
第1页 / 共36页
R语言与统计分析.pptx_第2页
第2页 / 共36页
R语言与统计分析.pptx_第3页
第3页 / 共36页
R语言与统计分析.pptx_第4页
第4页 / 共36页
R语言与统计分析.pptx_第5页
第5页 / 共36页
点击查看更多>>
资源描述

1、1什么是R?The R Project for Statistical Computing 主页:https:/www.r-project.org/Getting StartedRisafreesoftwareenvironmentforstatisticalcomputingandgraphics.ItcompilesandrunsonawidevarietyofUNIXplatforms,WindowsandMacOS.Todownload R,pleasechooseyourpreferredCRANmirror.IfyouhavequestionsaboutRlikehowtodown

2、loadandinstallthesoftware,orwhatthelicensetermsare,pleasereadouranswerstofrequentlyaskedquestionsbeforeyousendanemail.2简 史R语言是从S统计绘图语言演变而来,可看作S的“方言”。S语言上世纪70年代诞生于贝尔实验室,由Rick Becker,John Chambers,Allan Wilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,在国外学术界应用很广。1995年由新西兰Auckland大学统计系的Robert Gentlema

3、n和Ross Ihaka,基于S语言的源代码,编写了能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R与统计简介 很多人都把R作为一个统计系统来使用。我们倾向于把它当作环境,使得经典和现代统计技术在其中得到应用。一部分语句和程序已经被内建在基本的R语言环境中,但是更多的是以包的形式提供的。由8个包是随着R一同提供的(称作标准包),其它的可以通过CRAN的成员网站获得(通过http:/cran.r-project.org)。通过R可以使用绝大多数的经典或者最新的统计方法,不过用户需要花一些功夫来找出这种方法。R与其他主流的统计系统在本质上有一个很重要的不同。在R

4、中,统计分析通常由一系列的步骤完成,同时将交互的结果存储在对象中。所以,尽管SAS和SPSS在一个回归或者判别分析中会给出丰富的输出结果,R只是给出一个最小的输出,而将结果保存在一个适当的对象中由R函数进行后续查询。4R源程序R社区R核心团队R刊物R书籍R会议R主页主页User Groups,中文社区-统计之都国际国际useR!;中国中国-COS(Chat Open Share)上百种上百种,包括统计编程,统计模型,数据分,包括统计编程,统计模型,数据分析,统计图示,以及析,统计图示,以及for BioinformaticsThe R Journal,Volume 4/2,June 20122

5、0位,牛津大学、位,牛津大学、AT&T实验室实验室等等累计更新了累计更新了95个版本个版本1997年年959K2013年,年,24M5R的特点多领域的统计资源 目前在R网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。跨平台 R可在多种操作系统下运行,如WINDOWS、MACOS、多种LINUX和UNIX等。命令行驱动 R即时解释,输入命令,即可获得相应的结果。6为什么选择R?丰富的资源 涵盖了多种行业数据分析中几乎所有的方法。良好的扩展性 十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分析、绘制精美的图形。完备的帮助系

6、统 每个函数都有统一格式的帮助,运行实例。GNU软件 免费、软件本身及程序包的源代码公开。7R与其他统计软件比较SAS:速度快,有大量统计分析模块,可扩展性稍差,昂贵。SPSS:复杂的用户图形界面,简单易学,但编程十分困难。SPLUS:运行S语言,具有复杂的界面,与R完全兼容,昂贵。8R的缺点用户需要对命令熟悉 与代码打交道,需要记住常用命令。占用内存 所有的数据处理在内存中进行,不适于处理超大规模的数据。运行速度稍慢 即时编译,约相当于C语言的1/20。相比点击鼠标进行操作,R仍能够大大提高效率。9CRANThe Comprehensive R Archive Network简称CRAN,由

7、世界几十个镜像网站组成网络,提供下载安装程序和相应软件包。各镜像更新频率一般为1-2天推荐镜像:中国的镜像:数学所http:/ftp.ctex.org/mirrors/CRAN/即时更新的CRAN源http:/cran.r-project.org/10WINDOWS下载和安装RCRAN:BINARIESWINDOWSBASE 11R登陆界面(WINDOWS版)菜单栏菜单栏快捷按钮快捷按钮控制台控制台光标光标:等待输入等待输入12图 5 R GUI 的FILE菜单13图 6 R GUI 的EDIT菜单14R GUI 的PACKAGES菜单15图 8 R GUI 的HELP菜单16R程序包(RPA

8、CKAGES)程序包是什么?程序包是什么?R程序包是多个函数的集合,具有详细的说明和示例。WINDOW下的R程序包是经过编译的ZIP包。每个程序包包含R函数、数据、帮助文件、描述文件等。为什么要安装程序包?为什么要安装程序包?R程序包是R功能扩展,特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,常用到APE程序包,群落生态学VEGAN包等。17常用R程序包(I)ade4利用欧几里得方法进行生态学数据分析adephylo系统进化数据挖掘与比较方法ape系统发育与进化分析apTreeshape进化树分析bootBootstrap检验cluster聚类分析ecodist生态学数据相异性分

9、析FD功能多样性分析geiger物种形成速率与进化分析18常用R程序包(II)Graphics绘图lattice栅格图maptools空间对象的读取和处理mefa生态学和生物地理学多元数据处理mgcv广义加性模型相关mvpart多变量分解nlme线性及非线性混合效应模型ouch系统发育比较pgirmess生态学数据分析phangorn系统发育分析19常用R程序包(III)picante群落系统发育多样性分析raster栅格数据分析与处理seqinrDNA序列分析sp空间数据处理spatstat空间点格局分析,模型拟合与检验splancs空间与时空点格局分析statsR统计学包SDMTools物

10、种分布模型工具vegan植物与植物群落的排序,生物多样性计算20 VEGAN包页面三种平台上的程序包21R程序包一般Cran提供三种版本的安装包,开发的版本、发行版、以前的版本。下载发行的版本比较安全稳定。22安装程序包的方法1 直接用R上菜单里面的快捷键选择镜像后安装。2 用函数 install.packages(),如果已经连接到互联网,在括号中输入要安装的程序包名称,选择镜像后,程序将自动下载并安装程序包。例如:要安装picante包,在控制台中输入 install.packages(picante)3 安装本地zip包路径:Packagesinstall packages from l

11、ocal files选择本地磁盘上存储zip包的文件夹。23程序包使用程序包的中函数,都要先导入,再使用,因此导入程序包是第一步。在控制台中输入如下命令:程序包内的函数的用法与R内置的基本函数用法一样。library(BayesFactor)24查看程序包帮助文件BayesFactor程序包内部都有哪些函数?分别有什么功能?查询程序包内容最常用的方法:1 菜单 帮助Html帮助2 查看pdf帮助文档25查看函数的帮助文件函数的默认值是什么?函数的默认值是什么?怎么使用?怎么使用?使用时需要注意什么问题?使用时需要注意什么问题?需要查询函数的帮助。需要查询函数的帮助。1?t.test 2 RGu

12、iHelpHtml help3 apropos(t.test)4 help(t.test)5 help.search(t.test)6 查看查看R包包pdf手册手册26图 11 R帮助文件的内容与格式27帮助文件的内容lmstats#函数名及所在包 Fitting Linear Models#标题Description#函数描述Usage#默认选项Arguments#参数Details#详情Author(s)#作者References#参考文献Examples#举例28练习一 安装R并导入程序包1.安装R软件、熟悉菜单2.安装程序包 ISwR3.调用程序包,查看程序包的帮助library(IS

13、wR)29练习二 看看R能干什么?1.抽取1000个服从正态分布的随机数 e=rnorm(1000,0,1)(赋值-,或者=)2.生成一个简单的向量 x=(1:1000)/1000 3.做一个简单的运算y=sin(2*pi*x)+e(数和向量之间的加减乘除).4.绘图plot(x,y)数据的读入.txt文件读入.csv文件读入存为.txt文件write.table(data,file=data1.txt,row.names=F,quote=F)存为.csv文件 write.csv(data,file=data1.txt,row.names=F,quote=F)R数据的保存与加载 save(da

14、ta2,file=data2.Rdata)rm(data2)load(data2.Rdata)read.table(file,header=TRUE,sep=)read.csv(file,header=TRUE,sep=,quote=,dec=.,fill=TRUE,comment.char=,.)setwd(D:/R语言与统计分析课程课件)data=read.csv(beer.csv,na.strings=,header=T,sep=,)write.table(data,file=data1.txt,row.names=F,quote=F)data2=read.table(data1.txt

15、,header=TRUE)write.csv(data2,file=data2.csv,row.names=F)save(data2,file=data2.Rdata)rm(data2)load(data2.Rdata)print(data2)objects()被用来显示目前存储在R中的对象的名字。而当前存储的所有对象的组合被称为workspace。清除对象可以使用rm命令:所有在一个R任务中被创建的对象都可以在文件中被永久保存,并在其它的R任务中被使用。在每个R任务结束时用户都有机会保存当前有效的所有对象。如果用户这样做的话,对象将被写入当前目录一个名为.RData*Note3*。当R被再次

16、启动时R会从这个文件中再载入workspace。同时相关的命令记录也被载入。Ifyourdatasetdidnothaveaheader,Rhasprovidedsomeattributesforit,namely“V1”,“V2”,“V3”,“V4”and“V5”.data=read.csv(beer.csv,na.strings=,header=F,sep=,)data=read.csv(beer.csv,na.strings=,header=F,sep=,“,col.names=B1B2B3B4)read.table和 read.csv的用法总结Theseparatorsymbol;Th

17、eheaderargumentisalwayssetatTRUE,which indicates that the first line of the file being read contains the header with the variable names;ThefillargumentisalsosetasTRUE,which means that if rows have unequal length,blank fields will be added implicitly.read.table(file,header=FALSE,sep=,quote=,dec=.,row

18、.names,col.names,as.is=!stringsAsFactors,na.strings=NA,colClasses=NA,nrows=-1,skip=0,check.names=TRUE,fill=!blank.lines.skip,strip.white=FALSE,blank.lines.skip=TRUE,comment.char=#,allowEscapes=FALSE,flush=FALSE,stringsAsFactors=default.stringsAsFactors(),fileEncoding=,encoding=unknown,text)col.name=

19、c(t3,t4)read.csv()and read.csv2()read.csv()and read.csv2()Theread.csv()andread.csv2()functions are frequently used to read spreadsheets saved with the extension.csvor Comma Separated Values.As described before,read.csv()andread.csv2()have another separator symbol:for the former this is a comma,where

20、as the latter uses a semicolon(“;”).RememberRememberthat both functions have theheaderandfillarguments set asTRUEby default.Tipfindoutwhatseparatorsymbolisusedinyour.csvfilebyopeningitinatexteditor.查看数据dim(iris)#查看数据维数names(iris)#变量名称str(iris)#数据的结构attributes(iris)#数据的属性head(iris)#数据的前6行tail(iris)#数据的后6行iris1:5,#看1-5行iris,1:2#看1-2列iris1:10,Sepal.Length#查看某一列的前10行iris$Sepal.Length#同上

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服