收藏 分销(赏)

贾俊平版统计学课件.ppt

上传人:a199****6536 文档编号:12559350 上传时间:2025-10-30 格式:PPT 页数:28 大小:427.04KB 下载积分:10 金币
下载 相关 举报
贾俊平版统计学课件.ppt_第1页
第1页 / 共28页
贾俊平版统计学课件.ppt_第2页
第2页 / 共28页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,人的正常体温,大多数人认为,正常人的体温是恒定不变的,这是一种错误的认识。,事实上,体温在人体各个部位是不一样的,每日早、晚也不一样。另外,男女之间也有差异。,正常人口腔温度为,36.5,37.2,,腋下温度较口腔温度低,0.3,0.6,,直肠温度较口腔温度高,0.3,0.5,。,在一天的生物节律中,清晨,2,5,时体温最低,下午,5,7,时最高,但一天之内相差应小于,1,。另外,男、女的体温也有不同,女子体温一般比男子约高,0.3,。,所以说,人体体温有一个较稳定的范围,但并不是恒定不变的。,红楼梦,后,40,回出自谁的手笔,众所周知,,红楼梦,一书共,120,回,一般认为前,80,回为曹雪芹所写,后,40,回为高鹗所续,长期以来对这个问题一直有争议。能否从统计上做出论证,?,1985,、,1986,复旦大学李贤平教授带领他的学生作了这项有意义的工作。,他们创造性想法是将,120,回看成是,120,个样本,然后确定与情节无关的虚词作为变量,(,所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的,),,数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类。,果然将,120,回分成两类即前,80,回为一类,后,40,回为一类,很形象地证实了不是出自同一人的手笔。,之后又进一步分析前,80,回是否为曹雪芹所写,?,这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔,而后,40,回是否为高鹗写的呢,?,论证结果推翻了后,40,回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。,红楼梦,后,40,回出自谁的手笔,宝洁:,SK-,虚假广告风波,“连续使用28天,细纹及皱纹明显减少47%,肌肤年轻12年。”这是宝洁公司生产的SK-紧肤抗皱精华乳曾经使用的广告。,在这则广告的吸引下,一位名叫吕萍的江西消费者在南昌太平洋百货购买了一支SK-紧肤抗皱精华乳。但一个月过去后,吕女士发现非但无效,反而在使用中出现皮肤搔痒和部分灼痛的情况。她为此就虚假广告等问题委托律师唐伟状告宝洁。,江西南昌市工商局介入调查,经认定宝洁SK-II虚假宣传,并对其罚款20万元。,宝洁在致媒体的 中承认:“南昌市工商局的调查结果认为,SKII紧肤抗皱精华乳的产品宣传手册中对皱纹减少程度和肌肤年龄的定义不够清晰,皱纹减少47%和肌肤年轻12年的陈述属于实验中的最佳状况,但产品宣传手册中并未注明最高达字样,对实验数据的描述不够全面。”,第,1,章 导论,1.1,统计及其应用领域,1.2,统计数据的计量与类型,1.3,统计中的几个基本概念,1.1,统计及其应用领域,1.1.1,什么是统计学,statistics,的定义,(,不列颠百科全书,),statistics,:,the science of collecting,,,analyzing,,,presenting,,,and interpreting data,.,统计学的定义:统计学是收集、分析、表述和解释数据的科学,.,统计学是一门研究如何以有效的方式方法收集数据和整理数据,并在此基础上对数据进行分析,作出统计推断,从而对所研究的问题提供决策的科学,.,推断统计学关于如何根据样本数据推断总体的,表1 四种计量尺度的比较,psychology(心理学)psychophysics(心理物理学),作乘、除运算(即不能计算比值)。,因此,定序尺度具有(一个类别优于另,按照对现象计量的精确程度,计量尺度从低级到高级,从粗略到精确分为四个层次(等级)。,描述统计学与推断统计学,适用低层次计量尺度的统计方法也适用高层次计量尺度,在这则广告的吸引下,一位名叫吕萍的江西消费者在南昌太平洋百货购买了一支SK-紧肤抗皱精华乳。,meteorology(气象学)military science(军事科学),收集数据,就必须对所考察的现象进行计量或测度。,她为此就虚假广告等问题委托律师唐伟状告宝洁。,事实上,体温在人体各个部位是不一样的,每日早、晚也不一样。,采用不同的计量尺度可以得到不同类型的统计数据,而不同类型的统计数据又适用于不同的统计分析方法。,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类。,收集、分析、表述和解释数据的科学,1.,数据收集:取得数据,2.,数据分析:分析数据,3.,数据表述:图表展示数据,4.,数据解释:结果的说明,什么是统计学,?,统计研究的过程,收集数据,(,取得数据,),整理数据,(,处理数据,),解释数据,(,结果说明,),分析数据,(,研究数据,),实际问题,根据统计方法的不同,统计学可分为描述统计学与推,断统计学。,1.,描述统计学,关于如何收集数据和整理数据以及,如何描述,(,显示,),这些数据的一套统计方法,描述统计学是,统计学的基础。,2.,推断统计学,关于如何根据样本数据推断总体的,一套统计方法,推断统计学是统计学的核心内容。,描述统计学与推断统计学,显然这些类别具有等级差异,但不能具体测定等级之,一套统计方法,推断统计学是统计学的核心内容。,这就是说,统计数据是对所考察现象进行计量的结果。,在这则广告的吸引下,一位名叫吕萍的江西消费者在南昌太平洋百货购买了一支SK-紧肤抗皱精华乳。,dentistry(牙医学)ecology(生态学),事实上,体温在人体各个部位是不一样的,每日早、晚也不一样。,有限总体的范围能够明确确定,且元素的数目是有限的.,患肺癌是否有关(这种分析方法在统计学中称独立性检验),但是为,taxonomy(分类学)weather modification(气象改善),学生)划分为不同的类型,但各类型之间是平行的关系,,计量结果为数值,适用低层次计量尺度的统计方法也适用高层次计量尺度,若用 表示抽取一个个体时的变量值,则 是随机变量,并且 的所有可能取值即为总体,于是也可把随机变量 称为总体。,按照对现象计量的精确程度,计量尺度从低级到高级,从粗略到精确分为四个层次(等级)。,这就是说,统计数据是对所考察现象进行计量的结果。,historical research(研究)human genetics(人类遗传学),描述统计学关于如何收集数据和整理数据以及,例如企业信誉等级就是对企业信誉好坏的一种次序测,crystallography(晶体学)demography(人口统计学),6 人力资源管理,在这则广告的吸引下,一位名叫吕萍的江西消费者在南昌太平洋百货购买了一支SK-紧肤抗皱精华乳。,描述统计学与推断统计学,例如,收入就有实际的0作为起点,0表示没有收入。,没有绝对零点,只能进行加、减运算,2 产品质量管理,各类别具有某种意义上的等级差异,但不能具体,表1-1 统计的应用领域,按事物属性进行分类或分组,没有等级之分,计量结果为每一类,描述统计,内容,搜集数据,整理数据,展示数据,描述性分析,目的,描述数据特征,找出数据的基本规律,0,25,50,Q1,Q2,Q3,Q4,¥,推断统计,内容,参数,估计,假设检验,目的,对总体特征作出推断,样本,总体,概率论,描述统计学,推断统计学,反映客观,现象的统,计数据,总体内在的数量,规律性,样本数据,总体数据,(,总体,),(,收集和整理,),(,理论基础,),(,估计或检验,),1.,对于总体数据,由描述统计学方法就可以了解总体的数量规律,2.,对于样本数据,必须采用推断统计学方法才能了解总体的数量规律,描述统计学与推断统计学,1.1.2,统计的应用领域,1,企业发展战略,2,产品质量管理,3,市场研究,4,财务分析,5,经济预测,6,人力资源管理,统计学,经济学,管理学,医学,工程学,社会学,表,1-1,统计的应用领域,actuarial work(精算)agriculture(农业),animal science(动物学)anthropology(人类学),archaeology(考古学)auditing(审计学),crystallography(晶体学)demography(人口统计学),dentistry(牙医学)ecology(生态学),econometrics(经济计量学)education(教育学),election forecasting and projection(选举预测和策划),engineering(工程)epidemiology(流行病学),finance(金融)fisheries research(水产渔业研究),gambling(赌博)genetics(遗传学),geography(地理学)geology(地质学),historical research(研究)human genetics(人类遗传学),表,1-1(,续,),hydrology,(,水文学,),industry,(,工业,),linguistics,(,语言学,),literature,(,文学,),manpower planning,(,劳动力计划,),management science,(,管理科学,),marketing,(,市场营销学,),medical diagnosis,(,医学诊断,),meteorology,(,气象学,),military science,(,军事科学,),nuclear material safeguards,(,核材料安全管理,),ophthalmology,(,眼科学,),pharmaceutics,(,制药学,),physics,(,物理学,),political science,(,政治学,),psychology,(,心理学,),psychophysics,(,心理物理学,),quality control,(,质量控制,),religious studies,(,宗教研究,),sociology,(,社会学,),survey sampling,(,调查抽样,),taxonomy,(,分类学,),weather modification,(,气象改善,),应用统计学与其他学科的关系,1.,应用统计学的各分支可为各具体的应用领域提供数据分析工,具,例如生物统计学可为生物学的数量研究提供数据分析工具,.,2.,统计结论的进一步解释必须依靠相应学科的专业知识,即统,计学只能为各学科提供数据分析的工具,而分析所存在的问题和解,决问题则必须依靠各学科的专业知识,.,例如,根据对吸烟和不吸烟者患肺癌的数据,可以分析吸烟与,患肺癌是否有关,(,这种分析方法在统计学中称独立性检验,),,但是为,什么吸烟能导致肺癌,即形成这种数量规律的原因,就需要医学知,识来解释,.,1.2,统计数据的计量与类型,数据的计量尺度,收集数据,就必须对所考察的现象进行计量或测度。这就是说,统计数据是对所考察现象进行计量的结果。对于不同现象,能够计量的程度是不同的。有些现象只能定性(分类),例如人口的性别和民族,企业的信誉等。而有些现象则可以定量(数值),例如温度和收入等。按照对现象计量的精确程度,计量尺度从低级到高级,从粗略到精确分为四个层次(等级)。,采用不同的计量尺度可以得到不同类型的统计数据,而不同类型的统计数据又适用于不同的统计分析方法。,定类尺度是最粗略,计量层次最低的计量尺度。这种,计量尺度按事物属性进行分类或分组,但没有等级之分。,也就是说,这种计量尺度只能进行平行的分类或分组。,计量结果为每一类别的频数或频率,分类时必须符合穷尽和互斥的要求,例如一个学校的学生按性别分为男、女两类,或按民,族分为汉族和少数民族两类。这种分类把所考察的个体(,学生)划分为不同的类型,但各类型之间是平行的关系,,不能区分优劣或大小。也就是说,定类尺度只能区分个体,是同类或不是同类,具有,=,(是同类)及(不是同类),的数学特性。,1.,定类尺度,这种计量尺度按事物属性进行分类或分组,同时可排,序。即定序尺度不仅可以划分类型,而且还可以确定这些,类别的优劣或顺序,.,计量结果为每一类别的频数或频率,各类别具有某种意义上的等级差异,但不能具体,测定等级之间差异的大小,例如企业信誉等级就是对企业信誉好坏的一种次序测,度,它可以把企业信誉分为好、较好、一般和较差四个类,别。显然这些类别具有等级差异,但不能具体测定等级之,间差异的大小。因此,定序尺度具有,(一个类别优于另,一类别)和,(一个类别不如另一类别)的数学特性。,2.,定序尺度,这种计量尺度不仅能进行分类和排序,并且能测定,类别之间的差距,.,计量结果为数值,没有绝对零点,只能进行加、减运算,例如温度的计量结果为一个数值,当我们按,10,划,分一个等级时,则相邻两个类别的差距为,10,。并且温,度没有一个实际的,0,作为起点,,0,表示一种温度水平,并,不是没有温度。假如甲地:,30,,乙地,15,,可以说甲,地温度比乙地高,15,,但不能说甲地比乙地热,2,倍。因此,,对于定距尺度,其结果可以进行加、减运算,但不能,作乘、除运算(即不能计算比值)。,3.,定距尺度,这种计量尺度不仅能进行分类和排序,也能测定类,别之间的差距,还能计算两个测度值之间的比值。,计量结果为数值,有绝对零点,除进行加、减运算外,还可以进,行乘、除运算,定比尺度与定距尺度的唯一差别就是定比尺度有实,际的,0,作为起点。,例如,收入就有实际的,0,作为起点,,0,表示没有收入。,假如甲收入,600,元,乙收入,300,元,可以说甲比乙多收入,300,元,也可以说甲收入是乙的两倍。因此,定比尺度,可以进行加、减、乘、除运算。,4.,定比尺度,表,1,四种计量尺度的比较,计量尺度,数学特性,定类尺度,定序尺度,定距尺度,定比尺度,分类(,),排序(,),间距(,),比值(,,,),高层次的计量尺度可化为低层次计量尺度,反之则不行,适用低层次计量尺度的统计方法也适用高层次计量尺度,,反之则不行,1.2.2,统计数据的类型,统计数据的分类,按计量尺度,按收集方法,按时间状况,分类数据,顺序数据,数值型数据,观察数据,实验数据,截面数据,时序数据,图,1-1,统计数据的分类,1.,按计量尺度分,1),分类数据,(categorical data),按事物属性进行分类或分组,没有等级之分,计量结果为每一类,别的频数或频率,.,数据表现为类别,用文字来表述,.,例如,学校的学生按性别分为男、女两类,.,2),顺序数据,(rank data),按事物属性进行分类或分组,同时可排序,.,即还可以确定这些,类别的优劣或顺序,.,计量结果为每一类别的频数或频率,但不能具,体测定等级之间差异的大小,.,数据表现为类别,用文字来表述,.,例如,产品按品质分为一等品、二等品、三等品、次品等,.,3),数值型数据,(metric data),不仅能进行分类和排序,也能测定类别之间的差距,还可以计算,两个测度值之间的比值。计量结果为数值,.,例如:身高为,180cm,、,170cm,、,165cm.,2.,按收集方法分,1),观测数据,(observational data),通过调查或观测而收集到的数据,(,没有对事物人为控制的条件下,而得,),社会经济现象的统计数据几乎都是观测数据,.,2),实验数据,(experimental data),在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,.,自然科学领域的数据大多数都为试验数据,.,3.,按时间状况分,1)截面数据(cross-sectional data),在同一时点或同一时期收集的数据,描述现象在某一时点或,时期的情况.,例如,年我国各地区的国内生产总值数据.,2)时间序列数据(time series data),在不同时间上收集到的数据,描述现象随时间变化的情况.,例如,2002年至 年国内生产总值数据.,1.3,统计中的几个基本概念,1.3.1,总体和样本,1,总体,(,population,),(1),统计研究对象的全体称为总体,总体的每个对象称为个体或单位,是调查研究的基本单位,.,(2),总体分为有限总体和无限总体,:,有限总体的范围能够明确确定,且元素的数目是有限的,.,无限总体所包括的元素是无限的,不可数的,.,由于通常只关心个体的一个或几个变量,从而也可把所有个体的变量值作为总体。若用 表示抽取一个个体时的变量值,则 是随机变量,并且 的所有可能取值即为总体,于是也可把随机变量 称为总体。,2,样本,(,sample,),从总体中按一定方式抽取的一部分个体,组成样本的个体数目称为样本容量,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服