1、统计与统计案例1. 统计的基本思想是用部份来估计总体。2. 统计中所考察的对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。一、 抽样方法类别共性个性联系适用范围简单随机抽样不放回等概率逐个抽取抽签法随机数表法个体少系统抽样均分预定规则起始时用简单随机抽样个体多分层抽样分层,按比例层内用简单随机抽样或系统抽样差异明显二、 用样本估计总体1. 数字特征数字特征样本数据直方图中的估计值平均数 每个长方形面积乘以其底边中点的横坐标之和中位数按序排列,最中间的数(或最中间两数的均值)均分直方图的面积众数出数次数最多的数
2、最高长方形中点的横坐标方差,为标准差小:高瘦大:矮胖 注意:,则的平均数为,方差为2. 图形特征1) 茎叶图2) 直方图 3) 条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开;直方图是用面积表示各组频率的多少,高表示每一组的频率除以组距,宽表示组距,条形图的高表示频数的多少,其宽是固定的,表示类别。三、 变量间的相关关系1 关系2 样本相关系数:时,认为两个变量有很强的线性相关关系。3 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。4编号123合计5 随机误差6 相关指数:的值越大,说明残差平方和越小,即模型的拟合效果起好。在线性回归模型中,表示解释变量对预
3、报变量的贡献率,越接近于1,表示回归效果越好。7 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总体的范围;预报值与精确值往往不一样。8 步骤1) 确定研究对象2) 画出散点图,观察其关系3) 用经验确定回归方程4) 按规则(如最小二乘法)估计回归方程中的参数5) 分析残差是否异常四、 统计案例(独立性检验)1 列联表分类变量合计合计2 等高条形图(分析频率特征)3 0.0100.0016.63510.828若要推断的论述为“A与B有关系”,则的值越大,说明“A与B有关系”成立的可能性越大,两个分类变量的关系就越强。反之越弱。当时,应判断为没有充分证据显示事件A与B有关系,而不能作为小于的量化值来判断,时,A与B有的可能性有关。