收藏 分销(赏)

(01)第1章--统计和数据(j5).pptx

上传人:a199****6536 文档编号:10252512 上传时间:2025-04-30 格式:PPTX 页数:29 大小:259KB 下载积分:10 金币
下载 相关 举报
(01)第1章--统计和数据(j5).pptx_第1页
第1页 / 共29页
(01)第1章--统计和数据(j5).pptx_第2页
第2页 / 共29页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,1-,#,2011,年,统计学基础,(,第三版,),数据分析,(,方法与案例,),作者 贾俊平,统计学基础,Fundamental Statistics,第,1,章 统计和数据,1.1,统计及其应用领域,1.2,统计数据及其类型,1.3,统计中的几个基本概念,2011,年,学习目标,统计学的含义,统计的应用领域,统计数据的类型,统计中的几个基本概念,1.1,统计及其应用领域,一、什么是统计学,二、统计的应用领域,三、统计的误用与滥用,第,1,章 统计和数据,一、什么是统计学,1.1,统计及其应用领域,2011,年,什么是统计学,?,(statistics),1.,收集数据:取得数据,2.,处理数据:图表展示,分析数据:利用统计方法分析数据,数据解释:结果的说明,得到结论:从数据分析中得出客观结论,收集、处理、分析、解释数据并从数据中得出结论的科学,2011,年,统计方法,统计方法,描述统计,推断统计,参数估计,假设检验,2011,年,描述统计,(descriptive statistics),研究数据收集、整理和描述的统计学方法,内容,搜集数据,整理数据,展示数据,描述性分析,目的,描述数据特征,找出数据的基本规律,0,25,50,Q,1,Q,2,Q,3,Q,4,¥,x,=30,s,2,=105,2011,年,推断统计,(inferential statistics),研究如何利用样本数据来推断总体特征的统计学方法,内容,参数,估计,假设检验,目的,对总体特征作出推断,样本,总体,二、统计的应用领域,1.1,统计及其应用领域,2011,年,统计的应用领域,【,例,1.1】,用统计识别作者,17871788,年,三位作者,Alexander Hamilton,,,John Jay,和,James Madison,为了说服纽约人认可宪法,匿名发表了著名的,85,篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的,12,篇论文的作者身份引起了争议,通过对不同单词的频数进行统计分析,得出的结论是,,James Madison,最有可能是这,12,篇论文的作者。现在,对于这些存在争议的论文,认为,James Madison,是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确,2011,年,统计的应用领域,【,例,1.2】,用简单的描述统计量得到一个重要发现,费舍,(R,A,Fisher),在,1952,的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现。,20,世纪早期,哥本哈根卡尔堡实验室的施密特,(J.Schmidt),发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向,然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值。由此,施密特推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳,(Dana)”,的科学考察船在一次远征中发现了这个场所,2011,年,统计的应用领域,【,例,1.3】,挑战者号航天飞机失事预测,在此次失事前,该航天飞机,24,次发射成功。将航天飞机送入太空的两个固体燃料推进器由,6,只,O,型项圈密封。在几次飞行中,曾发生过,O,型项圈被腐蚀或气体泄漏事故。这样的事故是及其危险的。前,24,次发射中有一次发动机遭到了永久性破坏。根据,23,次飞行中发生腐蚀或泄漏事故的次数,(,因变量,),及火箭连接处的温度,(,自变量,),数据,进行线性回归得到的回归方程为,当温度为,31,0,F,时,,O,型项圈发生事故的预计次数为,2.225,次。结果显示连接处的温度与,O,型项圈事故之间有一定的相关性。如果当时那些经理们看到了回归的预测结果,也许推迟发射会成为其谨慎的选择,2011,年,统计的应用领域,【,例,1.3】,挑战者号航天飞机失事预测,1986,年,1,月,28,日清晨,载有,7,名宇航员的挑战者号进入发射状态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存,推动航天飞机进入太空的两个固体燃料发动机是由,Thiokol,公司制造的。失事前一天晚上,,Thiokol,公司的经理们和国家航空航天局就如期发射还是推迟发射产生了争执。天气预报发射时的气温为,31,0,F,。争执的结果采纳了,Thiokol,公司经理们的建:按计划发射航天飞机。因为他们觉得没有确凿证据表明低温会对固体燃料火箭推进器的性能产生影响,三、统计的误用与滥用,1.1,统计及其应用领域,2011,年,统计的误用与滥用,产生误用和滥用的情形,不好的样本,过小的样本,误导性图表,局部描述,故意曲解,1.2,统计数据及其类型,一、分类数据、顺序数据、数值型数据,二、观测的数据和实验数据,三、截面数据和时间序列数据,第,1,章 统计和数据,2011,年,统计数据的分类,统计数据的分类,按计量层次,分类的数据,顺序的数据,数值型数据,按时间状况,截,面,的,数,据,时序的数据,按收集方法,观察的数据,试验的数据,2011,年,统计数据的分类,(,按计量尺度分,),分类数据,(categorical data),只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类,顺序数据,(rank data),只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等,数值型数据,(metric data),按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为,175cm,、,168cm,、,183cm,2011,年,统计数据的分类,(,按收集方法分,),观测数据,(observational data),通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据,试验数据,(experimental data),在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据大多数都为试验数据,2011,年,统计数据的分类,(,按时间状况分,),截面数据,(cross-sectional data),在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,,2005,年我国各地区的国内生产总值数据,时间序列数据,(time series data),在不同时间上收集到的数据,描述现象随时间变化的情况,比如,,2000,年至,2005,年国内生产总值数据,1.3,统计中的几个基本概念,一、总体和样本,二、参数和统计量,三、变量,第,1,章 统计和数据,2011,年,总体和样本,总体,(population),所研究的全部个体,(,数据,),的集合,其中的每一个个体也称为元素,分为有限总体和无限总体,有限总体的范围能够明确确定,且元素的数目是有限的,无限总体所包括的元素是无限的,不可数的,样本,(sample),从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量,(,sample size),2011,年,参数和统计量,参数,(parameter),描述总体特征的概括性数字度量,是,研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值,(,),、标准差,(,),、总体比例,(,),等,总体参数通常用希腊字母表示,统计量,(statistic),用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值,(,x,),、样本标准差,(,s,),、样本比例,(,p,),等,样本统计量通常用小写英文字母来表示,2011,年,统计中的几个基本概念,平均数,标准差,比 例,参数,统计量,x,s,p,总体,样本,2011,年,变 量,(variable),说明现象某种特征的概念,如商品销售额、受教育程度、产品的质量等级等,变量的具体表现称为变量值,即数据,变量可以分为,分类变量,(,categorical variable,),:说明事物类别的名称,顺序变量,(rank variable,),:说明事物有序类别的名称,数值型变量,(metric variable,),:说明事物数字特征的名称,离散变量:取有限个值,连续变量:可以取无穷多个值,2011,年,几种常用的统计软件,(Software),典型的统计软件,SAS,SPSS,MINITAB,STATISTICA,Excel,MINITAB,STATISTICA,Excel,SAS,SPSS,2011,年,本章小节,统计学的含义,统计的应用领域,统计数据的类型,统计中的几个基本概念,结 束,THANKS,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服