1、高中数学选修1-2统计案例知识点讲义精品文档第一章 统计案例一、 回归分析的基本思想及其初步应用1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系.(1)按方向分类正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关
2、不相关(2)相关性系数r(在必修3中有介绍) 用相关系数r来衡量两个变量之间的相关关系 2、两变量之间的关系存在两种不同的类型(1)相关关系非确定性关系 (2)函数关系确定性关系3、 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。其基本步骤是:画出两个变量的散点图; 求回归直线方程; 并用回归直线方程进行预报。4、回归直线方程: 例如:5、相关指数是用来刻画回归效果的,越大,残差平方和越小,模型的拟合效果就越好。二、 独立性检验的基本思想及其初步应用1、列联表假设有两个分类变量X和Y,它们的值域分另为x1, x2和y1, y2,其样本频数列联表为: y1y2总计x1aba+bx
3、2cdc+d总计a+cb+da+b+c+d3、 独立性检验(1)利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验,并且能较精确地给出这种判断的可靠程度。(2)具体的做法是,由表中的数据算出随机变量K2的值。K2的值越大,说明“X与Y有关系”成立的可能性越大。 下表k是观测值,概率P为犯错误的概率。0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828例如:4、利用列联表直接计算发现 和 相差很大,就判断两个分类变量之间有关系。收集于网络,如有侵权请联系管理员删除