1、应用统计学教案 张敏主编第2章 统计数据的收集与整理教学内容2.1 统计调查的基本问题 2.2 统计调查的方式和方法 2.3 统计调查方案与问卷设计 2.4 统计数据整理 2.5 统计数据的显示 2.6 Excel 在统计整理中的应用 教学要求1了解统计调查的意义、基本原则、种类;2掌握统计调查的方式、方法;3了解统计调查方案的内容、问卷设计的方法,培养实事求是的专业素养;4掌握统计数据整理内容和步骤;掌握变量数列编制方法;5掌握统计资料的显示方法,能熟练制作统计图表,强化实践能力、培养耐心细致的工作作风,树立高度的社会责任感。教学重点统计调查的方式、方法;统计数据整理的内容和步骤;变量数列的
2、编制方法教学难点变量数列的编制方法教学方法课堂讲授、多媒体教学、课堂讨论、案例分析课时数4课时(讲授4课时)导入案例Staples连锁零售商店数据的收集与整理2.1 统计调查的基本问题2.1.1 统计调查的意义统计调查是统计工作的第一阶段,是整个统计工作的基础一环。只有做好统计调查,才能对统计整理和统计分析产生积极的影响。统计调查的全面性、准确性与及时性,是衡量统计调查工作质量的重要标志,是对统计调查的基本要求。2.1.2 统计调查的基本原则进行统计调查时,必须遵循以下基本原则。1. 实事求是,如实反映2. 及时反映,及时预报3. 数据与实际情况相结合2.1.3 统计调查的种类根据不同的调查目
3、的与要求以及调查对象的特点,选择合适的调查种类,这是统计调查的重要任务。统计调查可以从不同的角度进行分类。1全面调查与非全面调查2连续调查与非连续调查3直接调查、凭证调查、采访调查与问卷调查2.2 统计调查的方式和方法2.2.1 统计调查的方式1. 普查普查是为了特定目的而专门组织的一次性全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。普查是一种一次性的全面调查,它涉及面广、工作量大、时间性强、耗费多、组织工作复杂,因此普查工作必须统一指挥,严密组织,妥善安排。普查有如下几个特点。(1)普查具有周期性。(2)必须规定统一的标准时点。(3)确定统一的普查期限。(4)规定普查的项目与指
4、标。2. 抽样调查抽样调查是一种非全面调查,抽样调查分为概率抽样和非概率抽样。概率抽样有以下几个特点。(1)经济性好。(2)时效性强。(3)适用面广。(4)准确性高。抽样调查主要适用于以下场合。(1)对一些不可能或没必要进行全面调查的社会现象,采用抽样调查。(2)对普查资料进行必要的修正。由于普查涉及面广,工作量大,容易产生登记误差,即出现重复登记或遗漏现象。3. 重点调查重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查,它是一种不连续的调查。所选择的重点单位虽然数目不多,但它们的标志总量在总体总量中却占有较大比重。和抽样调查不同的是,重点调查取得的数据只能反映总体的基本发展趋势,
5、不能用以推断总体,因而也只是一种补充性的调查方法,目前主要是在一些企业集团的调查中运用。4. 典型调查典型调查是根据调查的目的与要求,在对被调查对象进行初步分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。典型调查可以分为两种:一是对个别典型单位进行详细的调查研究,称为解剖麻雀式典型调查;二是依据调查研究目的与任务的相关标志,把现象总体划分为不同的类型,然后从中选择出典型单位进行研究,称为划类选典式典型调查。 典型调查具有以下的主要作用。(1)补充全面调查的不足。(2)在一定的条件下可以验证全面调查数据的真实性。5. 统计报表制度统计报表制度是根据国家有关法规,自上而下地
6、统一布置,按照统一规定的表格形式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级汇总上报的一种调查方式。国家利用统计报表制度定期得到国民经济与社会发展情况的基本统计资料,是国家取得调查资料的主要方法之一。统计报表制度具有以下特点。(1)报表资料的来源是建立在各个基层单位的原始记录的基础上,基层单位可利用其资料对生产、经营活动进行监督管理。(2)由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料,了解本地区、本部门的经济和社会发展情况。(3)由于统计报表属于连续性调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。2.2.2 统计调查的方法1. 初级资料收集方
7、法(1)访问法访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。(2)观测法观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的一种调查方法,它具有目的性、计划性和系统性。观测法可代替直接发问的方法。(3)实验法实验法是一种特殊的观察调查方法,是指在所设定的特殊实验场所、特殊状态下,对调查对象进行实验以取得所需资料的一种调查方法。2. 次级资料的主要来源(1)统计年鉴(2)有关期刊(3)有关网站2.3 统计调查方案与问卷设计2.3.1 统计调查方案1调查任务与目的设计调查方案的首要工作是要明确调查的任务与目的,要搜集哪些资
8、料,要解决哪些问题,达到什么要求。2调查对象、调查单位与报告单位(1)调查对象。调查对象是需要进行调查的某个社会经济现象的总体,是由性质相同的许多调查单位组成的。(2)调查单位。调查单位是所要调查现象总体中组成的各个个体,也就是调查对象中所要调查的具体单位。调查单位的确定,取决于调查目的与调查对象。(3)报告单位。报告单位又叫填报单位,是指按照调查方案的要求负责向上级报送调查结果的单位。3调查项目与调查表(1)调查项目。调查项目是指作为调查内容规定下来的调查单位的特征,又称标志。(2)调查表。调查项目确定以后,必须将这些项目编制成调查表。4调查时间与地点调查时间主要包括两个方面:一方面是指调查
9、资料所属的时间范围(时点或时期)。在通常的情况下,调查地点与调查单位所在地是一致的,但有时也存在不一致的现象。5调查组织实施方案调查方案中还应当对本次调查的组织实施问题作出妥善安排。这些问题包括调查的组织领导机构、宣传教育、人员培训、文件印刷、经费筹措与开支办法、调查资料的报送程序与报送方式、调查结果公布的时间等。2.3.2 问卷设计1. 问卷的类型、结构与设计程序(1)问卷的类型调查问卷按照填写者不同,可分为代填式问卷和自填式问卷两种。调查问卷按照问题类型不同,可分为结构式问卷和开放式问卷两种。(2)问卷的基本结构调查问卷通常由前言、主体和结语三部分组成。前言部分列于问卷的前面,用来说明调查
10、目的、内容和要求,请被调查者给予合作等。它包括标题、问候语、填写说明、问卷编号等。主体部分是问卷的核心部分,主要包括调查的主要内容以及一些答题的说明。问卷的主题部分又分为两部分:一是被调查者的背景资料,即关于个人的性别、年龄、婚姻状况、收入等问题;二是调查的基本问题。通常我们把这两部分分开。结语部分是调查的一些基本信息,如调查时间、地点、调查员姓名、被调查者的联系方式等信息的记录。(3)问卷设计的程序问卷设计的程序如图2.1所示。图2.1 问卷设计的程序2. 调查问题的设计(1)调查问题的种类根据调查内容不同,问题可以分为事实性问题、意见性问题和解释性问题。(2)调查问题设计的基本要求问卷问题
11、的设计要清楚明了,通俗易懂,易于回答,同时能体现调查目的,便于答案的汇总、统计和分析。具体要求如下。所列出的问题必须符合客观实际情况一份问卷中的问题不宜太多,要有利于数据处理调查问题要考虑被调查者的回答能力,避免出现专业性很强的问题避免直接提禁忌的和敏感性的问题,如有要做技巧化处理问题提问要保持中立,不能带有诱导性和倾向性问题的内容要单一,一般只包含一个询问的内容问题的语言要清晰易懂,用语的定义必须清楚明确问题的排列要讲究逻辑性,先易后难,先事实性问题,后意见性问题和解释性问题3. 调查问题答案的设计(1)调查问题答案的设计形式二元选择式多元选择式顺位式程度评价式(量表形式) 利克特量表 语义
12、差异量表 数值分配量表 比较式自由回答式(2)调查问题答案的设计原则穷尽原则。互斥原则。版面清楚。2.4 统计数据的整理2.4.1 统计数据整理概述1. 统计数据整理的含义所谓统计数据的整理是指根据统计研究的目的和任务,将统计调查搜集的大量杂乱的原始资料进行分组和汇总,为统计分析提供系统化、条理化的综合统计资料的工作过程。2. 统计数据整理的内容和步骤(1)统计审核(2)统计分组(3)统计汇总(4)编制统计表和绘制统计图(5)统计数据资料的积累、保管和公布2.4.2 统计分组为了分析统计资料,必须先对统计资料进行分组。1. 统计分组的原则统计分组必须遵循两个原则,即穷尽原则和互斥原则。2. 统
13、计分组的方法统计分组如何进行取决于选择的分组标志是什么、有多少以及各组的分组标志取值如何,由此产生不同的分组方法。(1)按标志的种类分组总体单位的各个标志区分为品质标志和数量标志。(2)按标志的数量分组按标志的数量分组,可分为简单分组和复合分组。表2.1 简单分组与简单分组体系性别职工人数年龄职工人数职务职工人数男50040岁以下500管理人员100女40040岁以上400其他人员800合计900合计900合计900(a) (b) (c)对统计总体按照两个或两个以上的标志重叠起来进行的分组称为复合分组。复合分组对统计总体同时进行了两次或两次以上的分组,首先按主要标志分组,然后按照次要标志分组。
14、如表2.2所示,都是复合分组,形成一个复合分组体系。表2.2 复合分组与复合分组体系性别和年龄职工人数职务和性别职工人数男40岁以下300管理人员男7040岁以上200女30女40岁以下200其他人员男43040岁以上200女370合计900合计900(a) (b)复合分组时,分组标志越多,组数就成倍增加,各组的总体单位就会减少。因此进行复合分组设计时,要选择适当数量的分组标志。(3)按变量值的表现形式分组按变量值的表现形式,可分为单项式分组和组距式分组。单项式分组一般适用于变动范围不大的离散型变量。例如大学生按照年龄进行分组,由于年龄取值为整数,且大学生的年龄相对来说比较集中,因此可以设计成
15、单项式分组。如某地区家庭人口数统计的分组资料采用的是单项式分组,如表2.3所示。表2.3 单项式分组大学生年龄(岁)人数家庭人口数家庭数1830013001970024002018003430021120041000225005500合计4500合计6500(a) (b)组距式分组适用于连续型变量或者变动范围较大的离散型变量。例如全国人口按照年龄分组时,从0岁到100多岁,取值范围大,不宜采用单项式分组,而应采用组距式分组;资产总额是连续型变量,只能采用组距式分组,如表2.4所示。表2.4 组距式分组全国人口年龄(岁)人数(亿人)工业企业资产总额(万元)企业数(家)061.54000以下300
16、07153.040006000400016595.060008000200060993.08000100001000100以上0.510000以上600合计13.0合计10600(a) (b)在组距式分组中,每组包括许多变量值,每一组变量值中,其最小值为下限,最大值为上限。凡是组限不相连的,称为间断型组距式分组,如表2.4(a)所示。凡是组限相连(或称相重叠的),即以同一个数值作为相邻两组的共同界限,称为连续型组距式分组,如表2.4 (b)所示。连续型变量只能采用连续型组距式分组。在连续型组距式分组中,存在以同一个数值作为相邻两组共同的界限,根据统计分组的“互斥”原则,凡是总体中某一个单位的变
17、量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,亦称“上限不包括在内”原则。例如,表2.4(b)中,6000这个数值应该归入60008000组内,而不能归入40006000组内。(4)按组距是否相等分组组距指的是每组上限与下限之间的距离。按数量标志进行组距式分组,还可分为等距分组和不等距(或称异距)分组。3. 组距式分组中相关指标的计算(1)组距的计算统计分组中,组距式分组较为复杂。按数量标志进行组距式分组时,需要科学设计组数()、组距()和组限。通常按照标志值从小到大的顺序分成第一组、第二组最末组,组距是各组标志值的变动范围,该组标志值的最小值称为组下限,最大值称为组上限。既有上
18、限也有下限的组称为闭口组,缺少下限或者缺少上限的组称为开口组。对于闭口组(有下限和上限),组距的计算公式为组距(i)=组上限(u)-组下限(l)(2.1)采用组距式分组时,如果变量中存在极小值或极大值时,可以设计成“以下”或“以上”的开口组形式。在等距数列中可假定开口组的组距与其他组相等。在异距数列中,开口组的组距可根据全数列的变动规律来确定,若数列无规律可循时,则以相邻组的组距为准。例2.1 统计研究某班级35名学生的某课程考试成绩,学习成绩一般服从正态分布,存在极端值,一般设计成异距分组形式,如表2.5所示。五个组分别表示不及格、及格、中等、良好和优秀。表2.5 学生成绩分组表学生成绩(分
19、)人数组距(分)60以下3106070610708011108090101090100510合计35第一组为开口组,组距为邻近组组距,即组距为10。因此表2.5所示的分组在统计分析时按照等距分组对待。例2.2 将表2.4中全国人口按年龄分组资料转换成连续式组限,并计算各组组距,如表2.6所示。表2.6 人口分组表全国人口年龄(岁)间断式组限全国人口年龄(岁)连续式组限人数(亿人)组距(岁)06071.577157163.09165916605.0446099601003.040100以上100以上0.540合计合计13.0(2)组数的计算美国学者斯特杰斯(H.A.Sturges)总结出等距分组
20、时确定组距和组数的经验公式:全距(R)=(2.2)组数(k)=1+3.322lgN(2.3)组距(i)=(2.4)式(2.3)中,N为总体单位数。根据以上经验公式,可以求得确定组数的参考标准,见表2.7。表2.7 组数的参考标准N250k367891020为了计算分析的方便,组距最好是5或者10的倍数,组限的末位数最好是0或者5,并且要求第一组下限最小变量值,最末组上限最大变量值,以确保每一个总体单位都能归到相应的组内。例2.3 调查取得某区30家企业2020年工业增加值的计划完成程度,见表2.8,试进行组距式分组。表2.8 计划完成程度原始资料(%)818385909295979910010
21、1103105105108110112113113114115116117118118119120121125128129解:全距(R)=最大变量值-最小变量值=129%-81%=48%。组数(k)=1+3.322lgN=1+3.322lg305.9,取整数6。组距(i)=全距/组数=48%/6=8%,取10%,组数调整为5。第一组下限取80%,各组设计如下。第一组,80%90%;第二组,90%100%;第三组,100%110%;第四组,110%120%;第五组,120%130%。(3)组中值的计算组距式分组时各组的分组标志从组下限变化到组上限,组中值是指各组分组标志值的平均数,假设分组标志值
22、的变化是均匀的,则组中值的基本计算公式是(2.5)按照间断式组限分组时,需要转换成连续式组限后再计算组中值。闭口组时采用上式计算,开口组时需要采用以下近似算法。第一组为以下,缺少下限,则组中值=组上限- (2.6)最末组为以上,缺少上限,则组中值=组下限+(2.7)(4)频数和频率在统计分组的基础上,将总体所有单位按某一标志归类排列,称为频数分布,或次数分布,也称为分布数列。频数(次)用f表示。频率反映了各组频数的大小对总体所起作用的相对强度,它是各组频数与总体单位总和之比,计算公式为频率(2.8)频率有如下两个性质。(1)任何频率都是介于0和1之间的一个数,即01 (2.9)(2)各组频率之
23、和等于1,即(2.10)例2.4 某企业职工按月工资分组的资料如表2.9所示,各组的频率见表中第三列。表2.9 企业职工工资资料月工资(元)x职工人数(人)fi所占比重(%)700以下6067009001501590012002402412001600500501600以上505合计1000100(5)累计频数与累计频率编制向上累计频数(或频率)分布的方法是:由标志值小的组向标志值大的组依次累计,向上累计频数表明某组上限以下的各组单位数之和是多少,向上累计频率则表明某组上限以下的各组单位数之和占总体单位数的比重。例2.5 根据表2.9的资料,分别进行向上累计和向下累计。具体计算结果如表2.10
24、所示。表2.10 企业职工工资累计数表月工资(元)频数频率向上累计向下累计频数频率频数频率700以下600.06600.0610001.007009001500.152100.219400.9490012002400.244500.457900.79120016005000.509500.955500.551600以上500.0510001.00500.05合计10001.00累计频数具有两个特点:第一组的累计频数等于第一组本身的频数;最后一组的累计频数等于总体单位数。累计频率同样也具有两个特点:第一组的累计频率等于第一组本身的频率;最后一组的累计频率等于1。2.4.3 变量数列的编制统计调查
25、所收集的原始资料,是比较分散、凌乱的,无法显示现象总体的本质特征。一般来说,对所收集的资料按标志值大小进行排序,再观察各标志值分布是否均匀,决定是否采用等距分组。下面结合实例具体说明变量数列的编制过程。例2.6 某班40名学生的统计学考试成绩如下,根据下面的资料,试编制一个变量数列,来反映该班学生统计学考试成绩的分布状况。89568382987568857388749475837793809581828279829234837484857665868564886558828073解:第一步,对以上的数据按大小排序,结果如下。34565864656568737374747575767779808
26、081828282828283838384858585868888899293949598上述数据可以反映出资料的某些特征:该班统计学考试成绩分布在3498分之间,最高分为98分,最低分为34分,全距R=98-34=64(分)。第二步,计算组数和组距。组数(k)=1+3.322lgN=1+3.322lg406.32,取整数6。组距(i)=全距/组数=64/610.67,取整数10。第三步,需要指出的是,根据经验,由公式(2.3)求出的组数,当数据较少时,往往过多,当数据较多时,则往往过少。所以该公式只能作为参考之用。结合以上分析,可编制如下变量数列,见表2.11。表2.11 学生按成绩分组表成
27、绩(分)学生数(人)(频数)所占比重(%)(频率)60以下37.56070410.07080922.580901947.590以上512.5合计40100.02.4.4 统计汇总1统计汇总的组织形式对规模较大、级别较多的统计工作,需要选择统计汇总组织形式,统计汇总有以下三种组织形式。(1)逐级汇总(2)集中汇总(3)综合汇总2统计汇总技术统计汇总的工作量一般很大,为了高效率、高质量、经济地完成该项工作,需要根据不同的情况选用合适的统计汇总技术。统计汇总技术一般区分为人工汇总、机械汇总和计算机汇总三种。2.5 统计资料的显示2.5.1 统计表1统计表的结构从形式上看,统计表主要由总标题、横行标题
28、、纵栏标题和指标数值四个部分组成。从内容上看,统计表包括主词和宾词两个部分。统计表结构的一般形式如表2.12所示。2统计表的种类(1)统计表按作用不同分为调查表、整理表和分析表。调查表用于搜集原始资料,是调查单位的统计表;整理表是用于表现统计汇总或整理的表格;分析表是对统计整理的结果再进一步计算得到的最终结果。整理表和分析表往往结合在一起。(2)按照原始资料是否分组和分组的程度,统计表分为简单表、简单分组表和复合分组表三种。简单表是指主词没有经过任何分组的统计表。简单表的主词只是按总体各个单位简单排列或只按时间顺序简单排列,如表2.13所示。表2.13 2020年我国主要社会经济活动表指标计量
29、单位数量国内生产总值亿元1015986财政收入亿元180270财政支出亿元247850粮食万吨66949外商直接投资亿元10000出口总额亿元179326简单分组表是指主词按一个标志分组的统计表。可以按品质标志分组,也可以按数量标志分组,如表2.12就是按照产业划分的国内生产总值表。复合分组表是指对原始资料进行了复合分组,如表2.14所示,对企业职工人数按照性别和年龄两个标志进行了复合分组,得到复合分组统计表。分组既可以在横行标题上体现,也可以在纵栏标题上体现,或者两者都有。如表2.15是表2.14资料的另一种表现形式,能更简便地表现统计结果,且便于汇总。表2.14 企业职工人数统计表性别年龄
30、人数男30岁以下5003050岁60050岁以上300女30岁以下2003050岁30050岁以上100合计2000表2.15 企业职工人数统计表性别不同年龄人数合计(人)30岁以下3050岁50岁以上男5006003001400女200300100600合计70090040020002.5.2 统计图统计图是显示统计数据的直观、形象的方法,统计图有二维平面图、三维立体图等,具体有柱形图、折线图、饼形图、散点图等。根据所反映的统计数据的特点,选择合适的统计图。反映总体分布的统计图主要有次数和频率分布直方图、折线图、曲线图,累计次数和累计频率折线图、曲线图等。在计算机运用日益普及的今天,统计图表
31、的制作都可以借助计算机来完成。不仅专门的统计软件,普通的办公系统Excel也具有该功能。2.6 Excel在统计整理中的应用2.6.1 分布数列的整理分析在Excel中有两类方法可以实现分布数列的编制:第一,使用相关的函数,如Frequency函数;第二,应用【直方图】分析工具,【直方图】分析工具还可以进行向上累计,并能直接绘出直方图。但是,【直方图】分析工具与Frequency函数在编制分布数列时,并不符合统计分组的“上限不在内”原则,在实际应用时必须进行调整。2.6.2 实例应用1. 实例的数据描述例2.10 根据抽样调查,某月某市50户居民购买消费品支出(单位:元)资料如下:830 15
32、80 1050 1630 1180 1170 1010 1190 1080 1320880 1210 1100 1250 1030 1230 860 1260 1010 13801230 1460 1070 1360 870 1260 810 1350 1050 13101100 1170 1370 1270 1150 1380 1130 930 1250 12701180 1080 1200 1420 1410 1510 1140 1420 1160 1250对其按800900、9001000、10001100、11001200、12001300、13001400、14001500、1500
33、1600、1600以上,分为9个组来编制一个分布数列,以反映该月该市居民购买消费品支出的分布状况。2. 实例的操作步骤使用Frequency函数编制,主要步骤如下。(1)新建Excel工作簿,命名为“某月某市50户居民购买消费品支出分布情况”,并将样本数据和相关文字输入到工作表中。如图2.14所示,A、B、C列为原始输入数据。样本数据排成一列,本例中为A2:A51单元格区域,图2.14中未完全显示出来。(2)选定单元格区域,本例中选定的区域为D2:D10,单击【公式】菜单,选择【插入函数】选项,弹出【插入函数】对话框。在“选择类别”中选择“统计”,在“选择函数”中选择“FREQUENCY”,如
34、图2.15所示。 图2.14 数据输入 图2.15 【公式】下【插入函数】对话框(3)点击【确定】,打开“FREQUENCY”对话框,输入待分组数据A2:A51,与分组标志即分组上限899、999、1099、1199、1299、1399、1499、1599、1699,如图2.16所示。(4)按“Ctrl+Shift+Enter”组合键,在最初选定单元格区域内得到频数分布结果,在本例中为D2:D10,如图2.17所示。图2.16 “FREQUENCY”对话框 图2.17 频数分布结果使用直方图分析工具编制,主要步骤如下。(1)输入数据。如图2.18所示,A、B、C列为原始输入数据。样本数据排成一
35、列,最好对数据进行排序,本例中为A2:A51单元格区域,图2.18中未完全显示出来。列出分组上限和分组情况。(2)单击【数据】菜单,选择【数据分析】选项;打开【数据分析】对话框,从“分析工具”列表中选择“直方图”选项,如图2.19所示。 图2.18 原始数据输入 图2.19 【数据分析】对话框(3)打开“直方图”对话框,确定输入区域、接收区域和输出区域,如图2.20所示。“输入区域”输入待分析数据区域的单元格引用,若输入区域有标志项,则选中“标志”复选框;否则,系统自动生成数据标志。“接收区域”输入接收区域的单元格引用,该框可为空,则系统自动利用输入区域中的最小值和最大值建立平均分布的区间间隔
36、的分组。本例中输入区域为$A$2:$A$51,接收区域为$B$2:$B$10。在“输出”选项中可选择输出去向,本例中选择“输出区域”为$D$1。选择“柏拉图”可以在输出表中同时按降序排列频数数据;选择“累积百分率”可在输出表中增加一列累积百分比数值,并绘制一条百分比曲线;选择“图表输出”可生成一个嵌入式直方图。图2.20 “直方图”对话框(4)单击【确定】按钮,在输出区域单元格可得到频数分布,如图2.21所示。图2.21 直方图分析结果(5)将条形图转换成标准直方图。在直方图上按右键,选“设置数据系列格式-系列选项”,将“间隙宽度”设置为0 ,如图2.22所示。图2.23为直方图分布数列编制最
37、终结果。图2.22 设置数据系列格式图2.23 频数分布结果课程思政目标:数据是统计学的基本元素,也是后续统计描述和统计推断的基础,统计调查是获得数据的主要途径之一。在讲授统计调查基本方法和基本步骤时,可融入毛泽东寻乌调查的案例,以培养学生实事求是的科学精神。毛泽东曾说过“没有调查,就没有发言权”。毛泽东对中国革命的思考都是基于对现实的调查。1930年5月开始,在当时严酷的战争环境下,毛泽东先后在寻乌、兴国、长岗乡、才溪乡等地就中国农村和城镇的现状进行了深入调查,这些调查结果为制定农村包围城市的革命道路提供了有力的依据。还可融入1936年美国总统大选中文学文摘和盖洛普预测案例,让学生通过案例掌
38、握抽样方法及缺失数据对预测结果的影响,培养学生严谨细致的做事风格。研究来不得半点含糊。如果文学文摘在调查时能充分考虑到样本的偏差及对预测结果的影响,如果在对调查结果进行整理时能仔细考虑缺失问卷产生的原因,并及时采取相应的补救措施,也不可能导致文学文摘随后销声匿迹的凄凉结果,这说明做事要严谨细致。课程思政目标:统计整理就是采用合适的统计图表把收集到的数据展示出来。在学习此模块各类图表的使用场合及制作步骤的同时,教师可不失时机,在课堂上通过关注现实问题,培养学生高度的社会责任感和使命感。统计用数字记录社会生活,数字就是一面镜子,社会生活如何,镜子就照出什么样的结果。通过对石油、电力等自然资源历年数据的整理、展示和分析,引导学生关注能源危机问题,充分理解开发利用新能源、新动力的积极意义,深刻体会生态文明的重要性;采用柱状图、雷达图和折线图对城乡经济结构进行比较分析,有助于学生理解城镇化的必要性。诸如此类现实问题均可让学生通过统计整理练习而知晓。