收藏 分销(赏)

统计学基础-第一次作业.doc

上传人:精**** 文档编号:4036812 上传时间:2024-07-26 格式:DOC 页数:6 大小:46.04KB
下载 相关 举报
统计学基础-第一次作业.doc_第1页
第1页 / 共6页
统计学基础-第一次作业.doc_第2页
第2页 / 共6页
点击查看更多>>
资源描述
统计学基础 第一次作业 一、 填空题 1、 按照所采用的计量尺度不同,可以将统计数据分为_分类数据_、_顺序数据_和_数值型数据_. 2、 按照数据的收集方法的不同,可将统计数据分为_观测数据_和__实验数据_。 3、 按照被描述的对象与时间的关系,可将统计数据分为_截面数据__和_时间序列数 4、 体重的数据类型是:clear all。 5、 民族的数据类型是:CHAR。 6、 空调销量的数据类型是:电器。 7、 支付方式(购买商品)的数据类型是:分类变量。 8、 学生对教学改革的态度(赞同、中立、反对)的数据类型是:顺序数据。 9、 从总体中抽出的一部分元素的集合,称为___样本_____。 10、 参数是用来描述_总体特征_______的概括性数字度量;而用来描述样本特征的概括性数字度量,称为___统计量_____。 11、 参数是用来描述_总体特征_的概括性数字度量;而用来描述样本特征的概括性数字度量,称为_统计量_。 12、 统计数据有两种不同来源:一是_直接来源__,二是__间接来源___。 13、 统计数据的误差有两种类型,即__抽样误差_和_非抽样误差 。 14、 统计表由_数据__、__表头__、___行标题_和__列标题__四个部分组成. 15、 统计分组应遵循“不____重_____不__漏_______”、“___上限______不在组内”的原则. 16、 按取值的不同,数值型变量可分为_离散型变量__和_连续型变量_。 17、 在数据分组中,_离散型变量_______可以进行单变量值分组,也可以进行组距分组,而___连续型变量_____只能进行组距式分组。 18、 组距分组中,向上累积频数是指某组_上限以下_的频数之和。 19、 将某地区100个工厂按产值多少分组而编制的频数分布中,频数是_各组的工厂数__。 20、 频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这种分布的类型是_U型分布_。 21、 一组数据向某一中心值靠拢的倾向反映了数据的_中心点_。 22、 __众数_是一组数据中出现次数最多的变量值。 23、 一组数据排序后处于中间位置上的变量值称_中位数__。 24、 不受极端值影响的集中趋势度量指标有__中位数_和_众数__. 25、 一组数据的最大值与最小值之差称__极差___。 26、 __标准差系数__是一组数据的标准差与其相应的平均数之比。 27、 数据分布的不对称性是_偏态_。 28、 数据分布的平峰或尖峰程度称_峰态__。 29、 当偏态系数为正数时,说明数据的分布是_右偏分布__。 30、 集中趋势度量指标中的算术平均数、调和平均数_数值_______(容易、不易)受极端变量值影响. 31、 中位数适用于顺序变量和定量变量,不适用于_名义变量和次序变量_______。 二、 简答题 1、 什么是数据的集中趋势?反映数据集中趋势的指标有哪些? 答:数据的集中趋势在统计学中是指一组数据向某一中心值拢的程度,它反映了一组数据中心点的位置所在。 反映数据集中趋势的指标主要有:众数、中位数、分位数、平均数等. 2、 什么是数据的离散程度?常用的测度离散程度的指标有哪些? 答:离散程度反映的是各变量值远离其中心值的程度. 常用的测度离散程度的指标有:四分位差、方差、标准差、极差、离散系数等。 3、 简述众数、中位数和均值的特点和关系。 答:特点:众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数.可以没有众数也可有两个。 众数是一种位置代表值,它的应用场合比较有限。如:在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的众数值为代表. 中位数是将总体中各数据排序后,位于中点位置的.中位数也反映标志值的集中趋势,也是由位置决定的平均数。如,要在若干个连锁店间选择仓库或商品配送中心就可以利用这一性质,因而在工程设计中有应用价值。 均值集算术平均数,是数据集中趋势的最主要测度值。它反映了一组数据中心点或代表值,是数据误差互相抵消后客观事物必然性数量特征的反映. 总之,众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合较少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分。特别是当要用样本信息对总体进行推断时,均值就更显示出它的各种优良特征。均值在整个统计方法中应用最广,对经济、管理和工程等实际工作也是最为重要的一个代表值和统计量。 关系:若数据足够多,而且次数分布适度偏斜情况下,均值、中位数和众数三者间有较固定的关系.不论是在右偏还是左偏,中位数始终居于均值与众数之间.如果将均值和众数之间的距离视为1,则中位数与均值之间的距离为,中位数与众数之间的距离约占。根据这一关系,当已知其中两个代表值时,可用公式求出第三个代表值。 三、 综合计算题 1、 某班40名学生考试成绩如下: 66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 学校规定:60分以下为不及格,60-70分为及格,70-80分为中,80—90分为良,90—100分为优。 (1) 将该班学生分为不及格、及格、中、良、优五组,编制一张分数统计表。 考试成绩 学生人数/人 比率% 60分以下 3 7。5 60—70 6 15 70—80 15 37。5 80-90 12 30 90-100 4 10 合计 40 100 (2) 指出分组标志及类型、分组方法的类型、分析本班学生考试情况。 答:分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学不及格人数和优秀生的人数都较少,分别为7。5%和10%。大部分同学成绩集中在70~90分之间,说明该班同学成绩总体良好。    考试成绩一般用正整数表示时,可视为离散变量,也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。 2、 甲乙两班各有30名学生,统计学考试成绩如下: (1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。 答:乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高.因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出”两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。 3、 某班级25名学生的统计学考试成绩数据如下: 89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80,79,81,70,87,60 试计算: (1)该班统计学成绩的均值、中位数和四分位数; 答:`X=81。2 Me=82 Ql=74 QM=89 (2) 该班统计学成绩的方差、标准差。 答:S=11。18 S2=124.92 4、 某企业工人生产产品件数的分组资料如下: (1) 计算该企业工人的平均产量 答:`X=41。88 (2) 计算该企业工人产量的平均差和均方差; 答: Md=6.25 s=7.39 5、 某学院二年级两个班的学生外语考试成绩如下表: 试分别计算两个班的平均成绩和标准差,并比较说明哪个班的外语考试成绩差异程度更大。 答:英语统考成绩 学生人数 A班 B班 60以下 4 6 60~70 12 13 70~80 24 28 80~90 6 8 90以上 4 5 合计 50 60 四、 实操题(附加题) 完成教材P71Excel操作题,完成后将Excel文件连同此Word答案文档一同打包上传,完成效果如下图所示。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服