收藏 分销(赏)

经济管理数学概率统计及其应用.pptx

上传人:快乐****生活 文档编号:8866864 上传时间:2025-03-05 格式:PPTX 页数:78 大小:4MB 下载积分:16 金币
下载 相关 举报
经济管理数学概率统计及其应用.pptx_第1页
第1页 / 共78页
经济管理数学概率统计及其应用.pptx_第2页
第2页 / 共78页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,(2),古典概率,定义,5.3,(,概率的古典定义,),在古典概型中,如果基本事件的总数为,n,,而事件,A,又由其中,m,A,个基本事件组成,则定义事件,A,的概率为,这叫概率的古典定义,由它所定义的概率,称为古典概率,.,可见,对古典概型的问题,只要求出基本事件总数,n,和事件,A,所包含的基本事件数,m,A,,由公式,(5.,),就可直接计算事件,A,的概率了,.,(3),事件的关系和运算,1),包含 如果事件,A,发生,必然导致事件,B,发生,则称事件,B,包含事件,A,(,或称,A,是,B,的子事件,),,记为,A,B,.,2),相等 如果,A,B,,且,B,A,,则称事件,A,与事件,B,相等或等价,记为,A,=,B,.,3),并 两事件,A,与,B,中至少有一个发生所构成的事件称为,A,与,B,的并,(,或和,),,记为,A,B,.,4),交 两事件,A,与,B,同时发生所构成的事件,称为,A,与,B,的交,(,或积,),,记为,A,B,或,AB,.,例如,,A,2,A,3,=,A,1,5),互斥 事件,A,与事件,B,不能同时发生,即,AB,=,,则称事件,A,与,B,互斥,.,如产品合格,A,1,与产品不合格,为互斥事件,.,),互逆 如两事件,A,与,B,不同时发生,但又必须有一个发生,即,AB=,,且,A,B,=,,则称事件,A,与,B,互逆,(,或对立,),或称,B,是,(,或,A,是,),的对立事件,记为,B=A,(,或,A,=,B,).,7),差事件,A,发生,但事件,B,不发生所构成的事件称为事件,A,与,B,的差,记为,A,-,B,,显然,图,5.1,(4),概率的性质,性质,1,(,非负性,),对任何事件,A,,均有,性质,2,(,规范性,),必然事件的概率为,1,,即,性质,3,(,互斥可加性,),若事件,A,,,B,互斥,即,AB,=,,则,推论,1,若,A,1,,,A,2,,,,,A,n,两两互斥,即,推论,2,对立事件概率之和为,1,,即,性质,P,()=,.,即不可能事件的概率为零,.,性质,5,若,A,B,,则,性质,6,(,广义加法定理,),若,A,,,B,为任何二事件,则有,5.1.3,条件概率及其应用,在实际问题中,不仅要考虑事件,A,的概率,P,(,A,),,有时还需要研究在“事件,B,已发生”的条件下,事件,A,发生的条件概率,.,记为,P(A|B,).,(1),条件概率,定义,5.4,在事件,B,发生的条件下,事件,A,发生的概率叫做事件,A,在事件,B,发生的前提下的条件概率,记作,若,A,,,B,为两任意事件,且,P,(,B,),,则,(2),乘法定理,设,P,(,B,),,则,或设,P,(,A,),,则,类似地,例,9,设在,96,件产品中有,3,件次品,今无放回地依次抽取两件,问两件都是合格品的概率是多少?,解,设,A,i,表示“第,i,次取得合格品”,则两件都是合格品就是,A,1,,,A,2,同时发生,要求的是,P,(,A,1,A,2,),,由乘法公式,(3),事件的独立性,定义,5.5,若事件,A,与,B,满足条件:,则称事件,A,,,B,,,C,相互独立,.,定理,5.1,若事件,A,,,B,相互独立,则,这三对事件都相互独立,.,*,(4),全概率公式与贝叶斯公式,1),全概率公式 设事件,A,1,,,A,2,,,,,A,n,满足:,则对任何事件,B,有,2),贝叶斯,(,Bayes,),公式,设,n,个事件,A,1,,,A,2,,,,,A,n,满足:,则对任一概率不为零的事件,B,有:,5.1.4,二项概率公式,(1),贝努里,(Bernouli),概型,在相同的条件下,将同一试验重复做,n,次,如果每次试验的结果都与其他各次试验的结果无关,则称这种试验为重复独立试验,.,又如果每次试验只有两种可能结果,A,与 ,且事件,A,发生的概率,P,(,A,),在每次试验中保持不变,这种,n,次重复独立试验的随机现象称为,n,重贝努里概型,.,这是一种非常重要而又常见的概型,它有广泛的应用,许多实际问题都可归纳为这种概型,.,一个有放回的抽样模型,就是一个标准的贝努里概型,.,(2),二项概率公式,若一次试验中事件,A,发生的概率为,p,,则在,n,重贝努里试验中,事件,A,恰好发生,k,次的概率为,其中,q,=,-,p,.,5.2,随机变量及其分布,5.2.1,随机变量及其分布函数,(1),随机变量,定义,5.6,对于随机试验的每个可能结果,,都有唯一的一个实数值,X,(,),与它对应,则称,X,(,),为一个随机变量,简记为,X,.,(2),随机变量的分布函数,定义,5.7,设,X,是一个随机变量,,x,是任意一实数,令,则称函数,F,(,x,),为随机变量,X,的分布函数,.,(3),分布函数的性质,性质,1,(,有界性,),F,(,x,)1.,性质,2,(,单调不减性,),若,x,1,x,2,,则,F,(,x,1,),F,(,x,2,).,性质,3,(,左连续性,),F,(,x,-,0)=,F,(,x,).,5.2.2,离散型随机变量及其分布,(1),概率函数和分布函数,定义,5.8,设随机变量,X,的可取值为:,x,1,,,x,2,,,,,x,i,,,,其相应的概率分别为,p,1,,,p,2,,,,,p,i,,,,则等式,称为随机变量,X,的概率函数,表格,称为,X,的概率函数或分布列,并称,X,为离散型随机变量,.,离散型随机变量的概率函数具有以下两个基本性质,:,(2),常用的典型分布,1),两点,(0-1),分布,若随机变量,X,只能取,0,和,1,两个值,它们的概率分布是,P,X,=1,p,,,P,X,=0,q,(,p,q,=1),,则称,X,服从两点,(0-1),分布,或称,X,具有,0-1,分布,.,只要事件总数只有两个基本事件的,都能用两点分布来描述它,.,两点分布的分布列为,分布函数为,2),二项分布,若随机变量,X,的概率函数为,且,1,p,1,,,1,-,p,=,q,,则称,X,服从以,n,,,p,为参数的二项分布,记为,X,B,(,n,,,p,).,3),泊松,(Poisson),分布,若随机变量,X,可取一切非负整数,且概率函数为,则称,X,服从参数为,的泊松分布,记作,X,P,(,),5.2.3,连续型随机变量及其分布,(1),密度函数和分布函数,1),定义,5.9,如果存在非负函数,f,(,x),,使对任意实数,x,,随机变量,X,的分布函数,则称,X,为连续型随机变量,,f,(,x,),为,X,的概率密度函数,简称概率函数或密度函数,常称为密度函数,.,y,f,(,x,),的几何图形称为,X,的分布曲线,.,2),密度函数的性质,由定义可知,密度函数,f,(,x,),具有如下性质:,性质,f,(,x,),.,即,X,的分布曲线在,Ox,轴上方,.,性质,2,即介于分布曲线与,Ox,轴之间面积总和为,.,事实上,,性质,3,即,X,落在区间,a,,,b,),内的概率等于随机变量,X,的密度函数,f,(,x,),在区间,a,,,b,),上的定积分值,或等于区间,a,,,b,),上分布曲线下的曲边梯形的面积,.,事实上,,性质,4,在,f,(,x,),的连续点处,有,这里分析一下,f,(,x,),的意义,:,(2),常用的典型分布,1),均匀分布,若随机变量,X,的密度函数为,则称,X,在,a,b,上服从参数为,a,,,b,的均匀分布,记为,X,U,a,b,.,均匀分布的分布函数为,均匀分布的密度函数与分布函数的图形如图,5.6,所示,.,图,5.6,2),指数分布,若随机变量,X,的密度函数为,其中,k,0,,则称,X,服从参数为,k,的指数分布,它的分布函数为,指数分布的实际背景是各种消耗性产品的“寿命”,.,正因如此,指数分布常用来描述各种“寿命问题”,.,3),正态分布,若随机变量,X,的密度函数为,其中,a,为常数,且,,则称,X,服从参数为,a,,,2,的正态分布,记作,X,N,(,a,,,2,).,它的分布函数为,y,=,f,(,x,),的图形如图,5.7,所示,.,由微积分学知道:,x,=,a,时,,,f,(,x,),达到最大,分布曲线,y,=,f,(,x,),对称于直线,x,=,a,;,分布曲线,y,=,f,(,x,),两个拐点的横坐标为,x,=,a,;,分布曲线,y,f,(,x,),以,x,轴为水平渐近线;,若固定,,改变,a,之值,则分布曲线,y,f,(,x,),沿,x,轴平行移动,曲线的几何形状不改变;若固定,a,,而改变,之值,由,f,(,x,),的最大值可知,当,越大,,y,f,(,x,),的图形越平坦,当,越小,,y,f,(,x,),的图形越陡峭,如图,5.8,所示,.,图,5.7,图,5.8,特别地,若,X,N,(,a,,,2,),,当,a,=,,,=,时,称,X,服从标准正态分布,记作,X,N,(,,,).,标准正态分布的密度函数和分布函数分别用,(,x,),和,(,x,),来表示,即,标准正态变量,X,的密度函数,(,x,),和分布函数,(,x,),的图形如图,5.,(a),,,(b),所示,.,正态分布具有以下性质:,性质,1,若,X,N,(,,,),,则,(,见图,5.9(a),性质,2,若,X,N,(,a,,,2,),,,Y,N,(,,,),,且其分布函数分别为,F,(,x,),和,(,x,),,则,图,5.9,*,性质,若,X,N,(,a,,,2,),则,5.3,随机变量的数字特征,5.3.1,数学期望,(1),离散型随机变量的数学期望,定义,5.10,设离散型随机变量,X,的概率函数为,则称和式,为随机变量,X,的数学期望,(,或均值,),,记作,EX,,即,当,X,可取无穷多个值时,若级数 绝对收敛,则,EX,存在,且,EX,=.,如,Y,g,(,X,),是随机变量,X,的函数,则,Y,的数学期望记为,其中,p,i,为,X,的概率函数,.,例,27,设,X,的分布列为,求,EX,,,EX,2,,,E,(,X,2,-,).,这里指出,随机变量,X,的数学期望,EX,可为一切实数,且它表达了,X,取值的“集中趋势”,.,(3),数学期望的性质,设,a,,,b,,,c,为常数,,X,,,Y,为随机变量,且,EX,,,EY,均存在,则数学期望具有以下性质:,性质,Ec,=,c,,即常数的数学期望就是它本身,.,性质,EcX,=,cEX,.,性质,E,(,X,Y,),EX,EY,.,推论,E,(,X,1,+,X,2,+,+,Xn,)=,EX,1,+,EX,2,+,+,EX,n,.,性质,E,(,aX,+,b,)=,aEX,+,b,.,性质,设,X,,,Y,独立,则,E(,XY,)=,EX,EY,.,推论,设,X,1,,,X,2,,,X,n,相互独立,则,5.3.2,方差,(1),方差概念,定义,5.12,设随机变量,X,的数学期望为,EX,,如果,存在,则称,E,(,X,-,EX,),2,为随机变量,X,的方差,记为,DX,,即,又称,为,X,的标准差或均方差,记为,(,X,).,(2),方差的性质,设,a,,,b,,,c,为常数,且,DX,,,DY,存在,方差具有以下性质,:,性质,Dc,=,.,即常数的方差为零,.,性质,D,cX,=,c,2,DX,.,性质,若,X,,,Y,相互独立,则,D,(,X,Y,)=,DX,+,DY,*,5.3.3,统计中常用的矩,(1),原点矩,定义,5.13,设,X,是随机变量,若对于正整数,k,,,|,X,|,k,的数学期望,E|X|,k,+(,k,=,,,),,则称,EX,k,为,X,的,k,阶原点矩,记为,v,k,,即,显然,数学期望就是一阶原点矩,即,EX,=,v,1,.,(2),中心矩,定义,5.14,设,X,是随机变量,若对于,X,的离差的正整数,k,次幂,|,X,-,EX,|,k,的数学期望,E,|,X,-,EX,|,k,+(,k,=1,,,2,,,),,则称,E,(,X,EX,),k,为,X,的,k,阶中心矩,.,记为,显然,方差就是二阶中心矩,即,DX,=,且一阶中心矩恒为零,即,E,(,X,-,EX,)=,.,(3),相关矩,(,或协方差,),由于随机变量,X,与,Y,各自的期望与方差仅仅反映它们作为一维随机变量自身的特征,.,对于二维随机变量,(,X,,,Y,),,自然希望定义出能够反映各分量,X,与,Y,之间的联系的某种数字特征,这就引出了相关矩的概念,.,定义,5.15,设,X,、,Y,为定义在同一样本空间,上的两个随机变量,对二维随机向量,(,X,,,Y,),,若,E,(,X,-,EX,)(,Y,-,EY,),存在,则称它为随机变量,X,与,Y,的相关矩,(,或协方差,),,记为,Cov(,X,,,Y,),,即,相关矩是二维随机变量的一个重要数字特征,它刻画了,X,与,Y,的取值之间的相互联系,用来描述随机变量之间的相关性,.,顺便指出:若,X,与,Y,相互独立,则,Cov(,X,,,Y,)=,.,反之,不成立,.,又若,X,、,Y,为随机变量,则,(4),相关系数,定义,5.16,设随机变量,X,与,Y,的相关矩,Cov(,X,,,Y,),和各自的方差均存在,且,DX,,,DY,,则称,为,X,与,Y,的相关系数,记为,(,X,,,Y,),,即,(5),切比谢夫不等式,设随机变量,X,有数学期望,EX,和方差,DX,,则对任意的,,有,5.4,统计分析中的样本分布,5.4.1,几个基本概念,(1),总体与个体,在数理统计中,把研究对象的全体所构成的集合称为总体,把构成总体的每个单元称为个体,(,或样品,).,(2),样本与容量,定义,5.17,若按一定规则,从总体,X,中,随机抽取,n,个个体,X,1,,,X,2,,,,,X,n,,这,n,个个体,X,1,,,X,2,,,,,Xn,就称为总体,X,的一个容量为,n,的样本,简称样本,.,定义,5.18,在数理统计中,把满足相互独立且与总体,X,同分布的样本,X,1,,,X,2,,,,,X,n,,称为简单随机样本,.,(3),统计量,定义,5.19,设,X,1,,,X,2,,,,,X,n,是总体的样本,则样本的函数,称为统计量,.,5.4.2,样本的数字特征,定义,5.20,设,X,1,,,X,2,,,,,X,n,是总体,X,的样本,称统计量 为样本均值,记为,称统计量 为样本方差,记为,并称 为样本标准差,.,在实际应用中,用得最多的还是一阶样本原点矩和二阶样本中心矩,亦即样本均值 和样本方差,S,2,.,显然,5.4.3,抽样分布,(1),u,-,分布,定理,5.2(,样本均值的分布,),设样本,X,1,,,X,2,,,,,X,n,来自正态总体,X,N,(,a,,,2,),,则统计量,推论 若,X,N,(,a,,,2,),,,X,1,,,X,2,,,,,X,n,为总体,X,的样本,且,为其样本均值,.,则统计量,服从标准正态分布,即,通常称它为,U,统计量,后面将用,U,统计量对总体进行推断,.,U,统计量的分布称为,u,-,分布,.,(2),-,分布,定义,5.21,设样本,X,1,,,X,2,,,,,X,n,来自标准正态总体,X,N,(0,,,1),,则统计量,称为自由度为,n,的,变量,其分布称自由度为,n,的,-,分布,记为,(,n,).,变量的分布曲线与,n,有关,如图,5.10,所示,当,n,越大时,它就越接近正态分布,当,n,30,时,,-,分布就可用正态分布去近似,.,-,统计量有以下性质:,设,X,1,X,2,X,n,为来自正态总体,X,N,(,a,),的样本,则,(3),t,-,分布,定义,5.22,设样本,X,1,,,X,2,,,,,X,n,来自正态总体,X,N,(,a,,,2,),,,,,S,2,分别为该样本的均值与方差,则统计量,称为自由度为,(,n,-,),的,T,变量,其分布称为自由度为,(,n,-,),的,t,-,分布,记为,T,t,(,n,-,).,5.5,参数估计与实例,5.5.1,点估计,定义,5.23,设 为未知参数,的估计量,若,则称 为,的无偏估计量,.,5.5.2,区间估计,(1),区间估计的意义,定义,5.24,设总体,X,的分布中含有未知参数,,由,X,的样本,X,1,,,X,2,,,,,X,n,所确定的两个统计量,T,1,和,T,2,,如果对于给定的正数,(,),有,则称区间,(,T,1,T,2,),是,的对应于置信概率为,1,-,的置信区间,,T,1,和,T,2,分别叫做置信区间的置信下限和置信上限,,100(1,-,)%,称为置信度,(,或信度,或置信概率,).,(2),EX,的区间估计,1),已知,DX,,求,EX,的置信区间,设总体,X,N,(,a,,,2,),,其中,2,已知,,X,1,X,2,X,n,为来自总体,X,的样本,则统计量,由正态分布表,(,附录,表,),,对给定的 ,存在一个值,(,临界值,),,使,这就是说,,EX,落在区间 内 的概率为,-,,区间,称为,EX,的置信区间,称为估计不准概率,,-,称为置信概率,称为在,条件下的临界值,.,2),未知,DX,,求,EX,的置信区间,实际应用中,经常遇到的是方差未知的情况,这时自然想到用,S,2,来代替未知方差,DX,,设,X,1,X,2,X,n,为来自正态总体的样本,则统计量,对给定的,,查,t,-,分布表,(,附录,表,),得临界值 ,使,于是得,EX,的置信区间为,(3),方差,DX,的区间估计,1),未知期望,EX,,求,DX,的置信区间,设,X,1,,,X,2,,,,,X,n,为来自总体,X,N,(,a,,,2,),的样本,,a,,,2,均未知,为了确定方差,2,的置信区间,可用样本方差,S,2,去作总体方差,2,的估计,采用统计量,.,对给定的 ,查,-,分布表,(,附录,表,4),得临界值 ,使得,于是,得方差,DX,=,2,的置信区间为,或,2),已知期望,EX,=,a,,求,DX,的置信区间,此时,DX,=,2,的,(,-,),的置信区间为,*,5.6,假设检验与实例,5.6.1,假设检验的基本思想方法,假设检验的基本思想是根据“小概率原理”而采用某种带有概率性质的反证法,.,5.6.2,正态总体均值,a,的假设检验,(1),已知方差 ,检验假设,H,0,:,a,a,0,设,X,1,,,X,2,,,,,X,n,为来自正态总体,X,N,(,a,,,),的样本,若,H,0,:,a,=,a,0,(,H,0,表示假设符号,,a,0,是已知常数,),为真,则样本均值,于是统计量,对于给定的显著性水平,,由附录,表可得临界值 ,并使得,显然 是一小概率事件,.,当样本,X,1,,,X,2,,,,,X,n,取观测值,x,1,,,x,2,,,,,x,n,时,统计量,U,的值为,U,0,,且,:,若 时,这说明小概率事件在一次具体试验中出现了,因此应该拒绝假设,H,0,:,a,=,a,0,;,若,时,则应该接受假设,H,0,:,a,=,a,0,.,上述检验法称为,u,检验法,.,当拒绝假设,H,0,时,常称总体期望,a,与,a,0,有显著差异;而接受假设,H,0,时,常称,总体期望,a,与,a,0,无显著差异,.,现将,u,检验法步骤归结如下:,1),提出检验假设,H,0,:,a,=,a,0,;,2),选取统计量,3),给定显著水平,,由 确定临界值 ;,4),计算统计量,U,的实现值,U,0,;,5),做出判断,当 时,则拒绝假设,H,0,;当 时,则接受假设,H,0,.,(2),未知方差,2,时,检验假设,H,0,:,a,=,a,0,设样本,X,1,,,X,2,,,,,X,n,来自正态总体,X,N,(,a,,,2,),,要检验假设,H,0,:,a,=,a,0,(,其中,a,,,2,均为未知参数,).,这里由于方差,2,未知,上面,u,检验法不能适用,为了得到一个不含未知参数,2,的统计量,自然想到用方差的无偏估计量,S,2,来代替,2,,于是选统计量,若,H,0,:,a,=,a,0,为真时,,当给定,,由附录,表,可得临界值 ,并使,计算,T,的实现值为,T,0,,,若 ,就拒绝,H,0,;,若 ,就接受,H,0,.,这种检验叫,t,检验法,.,5.6.3,正态总体方差,2,的假设检验,设样本,X,1,,,X,2,,,,,X,n,来自正态总体,X,N,(,a,,,2,),,这里,2,为未知参数,现在要检验假设,(1),已知期望,a,时,检验假设,当,H,0,为真时,统计量,若给定显著性水平 ,则可由附录,表,4,,查得临界值 与 使得,这种检验方法叫,2,检验法,.,(2),未知期望,a,时,检验假设,当,H,0,为真时,统计量,若给定显著性水平 ,则可由附录,表,查得临界值,使得,如图,5.15,所示,.,当由样本算得统计量,2,的值 ,,若 ,则拒绝,H,0,;,若 ,则接受,H,0,.,5.7,线性回归与实例,5.7.1,回归分析的意义,(1),两种不同类型的变量关系,图,5.15,类型,:确定关系,这类关系的特点是:对给定的变量,x,,另一变量,y,有确定的对应值,.,如平面区域圆的面积:,S,(圆面积),=,r,2,(,半径,),,电学中的欧姆定律:,U,(,电压,)=,I,(,电流强度,),R,(,电阻,),等,这些都是我们所熟知的函数关系,.,类型,:相关关系,这类关系的特点是:变量具有某种不确定性的关系,.,如人的身高与体重的关系,一般来说,人高一些,体重大一些,但同样高度的人,体重往往不尽相同,.,即不能由“身高”去确定“体重”,.,又如,农作物的收获量与气候、降雨、肥量等因素有关,但是同样的气候、雨量、肥量条件,其收获量未必完全相同,.,又再如,某商品的需求量与价格有关,一般而言,价高需求量小,价低需求量大,但同一价格的商品,需求量往往也有所不同,.,这些变量之间的关系无法用一个确切的数学表达式把它们表示出来,但确实它们之间又存在着密切关系,.,这种变量关系从本质上来说,是随机变量之间的关系,在统计分析中,把它们称为相关关系或统计关系,.,(2),回归分析的主要任务,回归分析的任务就是根据变量,x,与,y,的样本点,(,x,i,y,i,),,寻求并检验变量之间相关关系的回归函数,从而运用这个函数(经验公式)达到预测或控制的目的,.,5.7.2,一元线性回归方程的建立,(1),一元回归直线,若已知变量,x,与,y,之间存在某种相关关系,为了研究它们的具体关系,其中最简单的方法是通过样本观测值,(,x,i,,,y,i,)(,i,=,,,,,n,),做出散点图,看散点图中的散点是否大致分布在一条直线上,如散点几乎分布在一条直线上,就用一直线方程,y,=,a,+,bx,来近似地描述变量,y,与,x,的相关关系,这就是线性回归直线,.,(2),回归直线方程的建立,设,x,与,y,是两个具有相关关系的变量,采用独立试验的方法,对一个容量为,n,的样本观测值:,(,x,1,,,y,1,),,,(,x,2,,,y,2,),,,,,(,x,n,,,y,n,),,如何求出其回归直线方程,即如何确定,=,a+bx,中的,a,与,b,?,所求的回归直线方程,自然希望它尽可能地靠近每一个样本点,(,x,i,,,y,i,),,显然这样的直线有一个显著的特点:“对于所有,x,i,,观测值,y,i,与回归值,的偏离达到最小,.”,当,x,=,x,i,时,,y,的观测值为,y,i,,而其回归值为,=,a,+,bx,i,,所以在,x,i,处观测值,y,i,与回归值 的离差为,如图,5.19,所示,.,为避免其离差的相互抵消,采用离差平方和,来刻画,(,x,i,,,y,i,),与直线,y,=,a,+,bx,的偏离程度,一般所说的回归直线就是使,Q,为最小的直线,.,使,Q,(,a,,,b,),达到最小值的,a,与,b,的估计值,与 ,就是所需要的回归直线的截距与斜率,因此,求回归直线问题便转化为求,Q,取最小值的,a,与,b,的问题,.,根据微积分学求极值的原理,当,Q,(,a,,,b,),可微时,有,这是关于,a,,,b,的二元线性方程组,解之得,显然,,(5.51),式中的,(,,,),就是使,Q,(,a,,,b,),达到最小值的,(,a,,,b,),值,于是所求的线性回归方程就是,为便于记忆求回归系数 的公式,引入以下记号,此时,5.7.3,相关程度的检验,(1),相关系数,定义,5.25,称统计量,为样本相关系数,.,(2),相关系数的显著性检验,人们根据统计量,r,的概率性质,编制出了,r,的临界值表,即附录,表,6,,表中的数据就刻画了,|,r,|,与的接近程度,具体检验步骤如下:,1),提出假设,H,0,:,b,=0.,2),给出显著性水平,,查自由度为,(,n,-,),的相关系数表,(,即附录,表,6),得临界值,r,(,n,-,2).,3),计算相关系数,r,的实现值,r,0,.,4),比较,的大小,若,则,x,与,y,线性相关显著,即 有意义;若,则,x,与,y,线性相关不显著,或,x,与,y,不存在线性关系,即 无意义,.,其直观意义,见图,5.20.,5.7.4,线性回归分析的应用,(1),回归预测,图,5.20,如果回归直线配制较好,就可以用它来作变量的预测,对任一给定的,x,0,相应的,y,0,一般是以回归直线上的对应值 为中心的服从正态分布的随机变量,.,设这个随机变量,y,的方差为,2,,则,此式表明,当,x,=,x,0,时,对应的,y,值以,0.95,的概率落入区间,这个区间称为,y,的,0.95,预测区间,称为,y,的点预测值,.,y,的方差往往是未知的,但可以证明,它的方差近似为,其中,用,S,y,代替,,则对给定的,x,0,,概率为,0.95,的,y,0,的预测区间为,一般为方便起见,近似地取,1.96,为,2,,则上述区间近似为,由于,x,取值是变的,因此,y,的预测区间上、下限是平行于回归直线的两条直线,:,如图,5.21,所示,(2),回归控制,如果希望,y,落在区间,(,y,1,,,y,2,),内,则,x,取值区间可由图,5.21,中直线,L,1,L,2,对应的关系所确定,设,解出,x,1,,,x,2,,则,当 时,控制区间为,(,x,1,,,x,2,);,当 时,控制区间为,(,x,2,,,x,1,).,但必须注意:只有当,(,y,2,-,y,1,),4,S,y,时,所求控制区间才有意义,.,图,5.21,5.7.5,线性回归直线的简便求法,(1),平均值法,用平均值法来求线性回归直线方程,=,a,+,bx,中的系数,a,和,b,.,其具体做法是:,第一步,将,n,组数据,(,x,i,,,y,i,),分别代入回归方程,=,a,+,bx,;,第二步,把这,n,个方程均分为两组(分的组数等于欲求未知数的个数);,第三步,把每组内的方程分别相加,得到一个二元一次联立方程组;,第四步,解以上二元一次联立方程组,得系数,a,和,b,,即得所求线性回归直线方程,=,a,+,bx,.,(2),紧绳法,这种方法是将组数据所成的散点描在坐标纸上,.,如若画出的点群(即散点图)形成一直线形带,就在这点群中间画一条直线,使得该直线两边的点子差不多相等并尽可能靠拢,.,这条直线可以被近似地当作回归直线,.,利用它在坐标纸上就可直接进行预报,.,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服