1、相关性-课文学问点解析全析提示1.散点图为了了解人的身高与体重的关系,我们随机地抽取9名15岁的男生,测得身高、体重如下表:编 号123456789身高/cm165157155175168157178160163体重/kg524445555447625053从表中不难看出,同一身高157 cm对应着不同的体重44 kg和47 kg,体重不是身高的函数.假如把身高看作横坐标、体重看作纵坐标,在坐标系中画出对应的点,就会发觉,随着身高的增长,体重基本上是呈直线增加的趋势.图171在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个
2、图,通常把这种图叫做变量之间的散点图.散点图的制作通常有两种方法:一是手工绘图;二是用计算机作图.手工作图比较烦琐,也易消灭误差,不够精确,我们通常利用计算机作图,简洁而精确.下面,我们再看一个例子:在一次对人体脂肪含量和年龄关系的争辩中,争辩人员得到了一组数据(如下表):人体的脂肪百分比和年龄年 龄23273941454950脂 肪9.517.821.225.927.526.328.2年 龄53545657586061脂 肪29.630.231.430.833.535.234.6依据上述数据,人体的脂肪含量与年龄之间存在怎样的关系?一般地,对于某个人来说,他的体内脂肪不肯定随年龄增长而增加或
3、削减.但是把很多个体放在一起,这时就可能表现出肯定的规律性来.观看表中数据,大体上来看,随着年龄的增长,人体中的脂肪百分比也在增加.为了确定这一细节,我们需要对数据进行分析,可以作一个散点图,使我们对两个变量之间的关系有一个直观上的印象和推断.图172从散点图中我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间的确存在肯定的关系,这个图支持了我们从数据表中得出的结论.2.线性相关我们看下面几个散点图.图173从散点图上看,假如变量之间存在着某种关系,这些点会有一个大致的趋势(如图a、图b), 这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.若在两个变量x
4、和y的散点图中,全部点看上去都在一条直线四周波动,则称变量间是线性相关的.此时,我们可以有一条直线来近似表示(如图a).若全部点看上去都在某条曲线(不是一条直线)四周波动,则称此相关为非线性相关.此时,可以用一条曲线来拟合(如图b).假如全部的点在散点图中没有显示任何关系,则称变量间是不相关的(如图c).我们重点来争辩相关中的线性相关.下面我们再来看体内脂肪的含量与年龄的关系.那么,当人的年龄增长时,体内脂肪含量到底以什么方式增加呢?我们从脂肪含量与年龄的散点图中可以看出,这些点大致分布在通过散点图中心的一条直线四周,这两个量之间具有线性相关性.图174那么,如何确定这条直线呢?这条直线有什么
5、特点呢?要想确定这条直线,必需先弄清该直线的特点.这条直线代表了全部散点的进展变化趋势,也就是说全部散点到该直线的距离最小,使散点都尽可能地处在该直线的四周.下面我们看几种确定这条直线的方法.(1)我们可以接受测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离和最小的位置,测量出此时直线的斜率和截距,就确定了这条直线.图175(2)在图中选择这样两点画直线,使得直线两侧的点的个数基本相同.图176(3)我们还可以在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数作为要确定直线的斜率和截距.图177以上几种方法,确定的直
6、线方法差别很大,结果所确定的直线也有较大的差别.但是这种探究活动是格外有意义的,是查找最佳方案的必要前提.问题:(课本第54页)(1)制散点图时,我们一般要借助于计算机中的电子表格软件(Excel),以身高作为横坐标,以右手一拃长作为纵坐标,作图.图178从散点图188中可以发觉,身高与右手一拃长之间的总体趋势是成一条直线,也就是说它们之间是线性相关的.对第(2)小问题,课本给出四个解决方案,这四个方案从方法上差别较大,得到的数据也有肯定的差距,但不能否认这四种方法都有肯定的道理,我们想要得到的直线只是对其变化趋势的一个近似的描述,对于一个给定身高的人,我们用这条直线来估量这个人的右手一拃长,
7、是格外有意义的.那么,本节要想确定表示线性相关的直线,我们可以借助于电子表格软件来处理,至于从理论上怎么来处理这一问题,这将是下一节要争辩的内容.为了使取得的样本具有广泛代表性,应接受抽样的方法,如简洁随机抽样、分层抽样等抽样方法.思维拓展假如身高和体重存在函数关系,则图象应为平滑的直线或曲线,或为均匀分散在直线或曲线上的点.全析提示可利用计算机中的电子表格软件制作两个变量间的散点图.全析提示要从实践中不断提高分析数据的力量,我们往往借助于列表和作图来分析数据.全析提示在作散点图时,假设年龄影响体内脂肪含量,按习惯,以x轴表示年龄,以y轴表示脂肪含量.全析提示我们通常利用变量间的散点图来推断变
8、量间的关系.假如全部点看上去都在一条直线四周波动,则变量间是线性相关;若在某条曲线四周波动,则称非线性相关;若没有显示任何关系,则称不相关.全析提示这条直线必需能近似地代表散点的变化进展趋势.思维拓展此种方法确定直线有不足之处,通过移动直线使距离和最小,只是一种直观的感觉,缺乏严格规律.思维拓展此种方法保证直线两侧点数基本相同,但并不能保证全部散点到直线的距离和最小.思维拓展用此种方法来确定直线,由于图中点较多,任意两点确定一条直线,直线条数较多,难操作,并且也很难保证全部点到直线的距离和最小.全析提示用电子表格制散点图时,在第一列应输入x轴所表示的数据(身高),在其次列应输入y轴所表示的数据(右手一拃长).全析提示这四种方法都带有肯定的主观性,缺乏严格的理论依据和规律性.