收藏 分销(赏)

医药数理统计PPT课件.ppt

上传人:可**** 文档编号:747108 上传时间:2024-03-01 格式:PPT 页数:87 大小:1.71MB
下载 相关 举报
医药数理统计PPT课件.ppt_第1页
第1页 / 共87页
医药数理统计PPT课件.ppt_第2页
第2页 / 共87页
医药数理统计PPT课件.ppt_第3页
第3页 / 共87页
医药数理统计PPT课件.ppt_第4页
第4页 / 共87页
医药数理统计PPT课件.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、医药数理统计教师:吕 靖联系方式:电话:13789089073邮箱:QQ号:76756940办公室:公教楼1231.第一章.事件与概率第二章.随机变量的概率与数字特征第三章.实验设计第四章.抽样分布第五章.参数估计第六章.假设检验第八章.线性相关与回归分析第九章.正交设计概率规律统计方法主要内容第七章.方差分析第十章.均匀设计实验设计2.确定性现象:结果确定不确定性现象:结果不确定自然界与社会生活中的两类现象p抛出的物体会掉落到地上p明天天气状况p买了彩票会中奖p抛硬币出现正(反)面事件与概率3.一次抛掷硬币试验(出现正面朝上)多次抛掷硬币实验(出现正面朝上的次数)不确定近半数(规律)这种在个

2、别实验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。概率论与数理统计是研究和揭示随机现象规律性的一门数学学科。4.事件与概率第一节 随机事件及其运算一、随机事件l随机试验:对随机现象的观察(试验)l抛一枚硬币,观察l抛一颗骰子,观察l记录某城市120120急救电话台一昼夜接到的呼叫次数l观察某一电子元件的寿命l将一枚硬币连抛三次,考虑正(反)面出现的情况具有以上三个特点的试验成为随机试验,简称试验(E)。1、可以在相同条件下重复;2、每次试验的结果可能不止一个,并且能事先明确试验的所有可能结果;3、进行一次试验之前不能确定哪一个结果会出现。5.事件与概率l

3、样本空间:试验所有的结果的集合()l抛硬币:正面,反面l抛一颗骰子:1,2,3,4,5,6l记录某城市120120急救电话台一昼夜接到的呼叫次数:1 1,2 2,3 3,4 4,l观察某一电子元件的寿命:R+l将三枚硬币:正正正,正正反,正反反,反反反l随机事件:随机试验的结果(样本空间的子集)(A,B.)l基本事件:不能分解成其它事件的最简单的随机事件.l必然事件:每次试验必然发生()l不可能事件:每次试验都不会发生()6.二、事件间的关系与运算 l事件的包含:如果事件A发生必然导致B发生则称事件B包含事件A 或称事件A包含于事件B 或称A是B的子事件记作BA或AB说明:AB属于A的每一个样

4、本点一定也属于B 对任意事件A 易知A l事件的相等:如果事件A包含事件B 事件B也包含事件A 则称事件A与B相等(或等价)记作AB 说明:相等的两个事件总是同时发生或同时不发生事件与概率7.l事件的并(或和)“事件A与B至少有一个发生”这一事件称作事件A与B的并(或和)记作AB或AB 例.在投掷一枚骰子的试验中记A“点数为奇数”B“点数小于5”则AB?l事件的交(或积)“事件A和B都发生”这一事件称为事件A与B的交(或积)记作AB(或AB)说明:两个事件的并与交可以推广到有限个或可数个事件的并与交例.在投掷一枚骰子的试验中记A“点数为奇数”B“点数小于5”则AB?事件与概率8.l事件的差“事

5、件A发生而B不发生”这一事件称为事件A与B的差记作AB 例.在投掷一枚骰子的试验中记A“点数为奇数”B“点数小于5”则AB?l互不相容事件若事件A与B不可能同时发生也就是说AB是不可能事件即AB 则称事件A与B是互不相容事件事件与概率9.l完备事件组:设A1 A2 An是两两互不相容的事件并且和为,称A1 A2 An是一个完备事件组 例.考察某一位同学在一次数学考试中的成绩分别用A B C D P F表示下列各事件(括号中表示成绩所处的范围)A优秀(90 100)D及格(60 70)B良好(80 90)P通过(60 100)C中等(70 80)F未通过(0 60)则:A B C D F是两两不

6、相容事件P与F是互为对立的事件即有PF A B C D均为P的子事件且有PABCD l对立事件:“事件A不发生”这一事件称为事件A的对立事件记作A 如:在投掷一枚骰子的试验中“点数小于3”和“点数大于4”这两个事件是互不相容事件说明:在一次试验中如果A发生则A一定不发生如果A不发生则A一定发生因而有AA AA 问:对立事件与互不相容事件之间的关系?事件与概率10.三、随机事件的运算律1 关于求和运算(1)ABBA(交换律)(2)(AB)CA(BC)ABC(结合律)2 关于求交运算(1)ABB A(交换律)(2)(AB)CA(B C)AB C(结合律)3 关于求和与求交运算的混合(1)A(BC)

7、(AB)(AC)(第一分配律)(2)A(BC)(AB)(AC)(第二分配律)4 关于求对立事件的运算5 德摩根律事件与概率11.频 率 稳 定 值 概率 l概率的统计定义l频率:在相同条件下进行n次试验,事件发生的次数m称为事件发生的频数。称为发生的频率。记作l定义:当n足够大时,频率的稳定值p(注意概率与频率的区别)性质:第二节 事件的概率注:概率是一个随机事件所固有的属性,与试验次数以及每一次试验结果无关。频率的性质事件发生的频繁程度事件发生的可能性的大小概率的统计定义事件与概率一、概率的定义12.l概率的古典定义l前提:试验样本空间只包含有限个元素;每个基本事件发生等可能性。l定义:已知

8、样本空间 中基本事件总数为n,若事件A 包含 k 个基本事件,则有例:将一枚硬币抛三次,求(1 1)事件A=A=恰有一次出现正面(2 2)事件B=B=至少有一次出现正面?例:某学习小组有1010名同学,其中7 7名男生,3 3名女生,从中任选3 3人去参加社会活动,则3 3人全为男生的概率为?13.补充:排列与组合排列定义:从m个元素中,取出n(nm)个元素按一定顺序排成一列。记为组合定义:从n个元素中,任取k个为一组,得出的不同的组数,称为组合数。记作14.1.互斥事件加法定理(有限可加性)若事件A、B互斥,则有P(A+B)=P(A)+P(B)推广:若为两两互斥事件,则例.药房有包装相同的六

9、味地黄丸100盒,其中5盒为去年产品,95盒为今年产品。现随机发出4盒,求:有1盒或2盒陈药的概率。2.一般加法定理对任意两事件A、B,有P(A+B)=P(A)+P(B)P(AB)推广:对任意三事件A、B、C,有P(A+B+C)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)3.减法定理对任意的A、B,有P(A-B)=P(A)P(AB)二、概率的运算15.4.条件概率与乘法定理条件概率:在事件B已经发生的条件下,A发生的概率称为A的条件概率,记性质:一般情况下,例.袋中有2个白球,8个黑球,现让两个人去抽球(无放回)。若已知第一个人抽到白球,则第二个人也抽到白球的概率

10、是多少?乘法定理:推广公式:16.4.独立事件及其乘法定理独立事件:若或或则称时间A、B相互独立。定理:若A与B,A与,与B,与中有一对相互独立,则另外三对也相互独立。推广:若任意三事件A、B、C两两独立,且P(ABC)=P(A)P(B)P(C),则称A、B、C相互独立。多事件相互独立多事件两两独立例如:抛一枚硬币两次,记A=第一次为正面,B=第二次为反面,C=两次都为同一面。分析知,A、B、C两两独立,但不相互独立。独立事件的乘法定理:若相互独立,则注意:具有非零概率的两事件,互斥就不独立,独立就不互斥。例.若每人血清中有肝炎病毒的概率为0.4%,今混合100人的血清,求混合血清无肝炎病毒的

11、概率。17.1.全概率公式:若构成互斥完备群,则对任意事件B,有全概率公式的意义:在较复杂情况下直接计算P(B)不易,借助于一个完备事件组,将复杂事件分解成若干个互不相容的简单事件的和,再利用概率的加法公式求出复杂事件概率。例12.设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的药品占1/2,第二、三家分别占1/4,已知第一、二家药厂生产的药品有2%的次品,第三家药品有4%的次品。试求:现从药房任取一份,问拿到次品的概率?第四节 全概率公式和逆概率公式18.实际工作中还会遇到与全概率问题相逆的问题。如例12改成:设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的药品占1/2,

12、第二、三家分别占1/4,已知第一、二家药厂生产的药品有2%的次品,第三家药品有4%的次品。试求:拿到的药品是次品时,该次品由各家药厂生产的可能性为多大?2.逆概率公式(贝叶斯公式):设 是互斥完备群,则对任意事件B,有19.随机变量的概率分布与数字特征 第一节 随机变量与离散型随机变量的概率分布 引入随机变量使得随机事件可用随机变量的关系式表示,从而使对随机现象研究进一步深入、更数学化。1.1.随机变量 对于随机试验,若其试验结果可用一个取值带有随机性的变量来表示,且变量取这些可能值的概率是确定的,则称这种变量是随机变量。注意:随机变量常用X,Y,Z表示,而表示随机变量所取的值通常用x,y,z

13、表示。例如,从某一学校随机选一学生,测量他的身高。我们可把可能的身高看作随机变量X,然后提出关于X的各种问题。如P(X1.7)=?P(X1.5)=?P(1.5X1.7)=?一旦我们实际选定了一个学生并量了他的身高之后,我们就得到X的一个具体的值,记作x。这时,要么x1.7米,要么x 1.7米,再去求P(x1.7米)就没有什么意义。性质1:随机变量取任何值的概率均为非负。性质2:随机变量取所有可能值的概率之和为1。20.2.离散型随机变量 如果随机变量只能取有限个或无限可列个数值,则称它为离散型随机变量。例如:小白鼠存活的只数,引体向上次数等。3.连续型随机变量 如果随机变量的可能取值为某一区间

14、的所有实数,无法一一列举,则称他为连续型随机变量。例如:身高、体重等。21.4.4.离散型随机变量的概率函数 设离散型随机变量X X的所有可能取值为x xi i(i=1,2,)(i=1,2,),相应的概率P(X=xP(X=xi i)=p)=pi i称为离散型随机变量X X的概率函数或分布律。通常X的分布律可用表格表示:概率函数有如下性质性质:例.某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布。X x1 x2 xi P p1 p2 pi 5.5.离散型随机变量的分布函数设X是一个随机变量(可以是离散型,也可以是连续型),x是任意实数,则函数F(x)=P(Xx)称为随机变量

15、X的分布函数。性质:(1)F(x)为非减函数;(2)0F(x)1(-x+);(3)F(-)=0,F(+)=1;(4)F(x)右连续,即 例.给青蛙按每单位体重注射一定数量的洋地黄,由以往的实验知,致死的概率为0.60.6,存活的概率为0.40.4,现给两只青蛙注射,求死亡只数的概率函数和分布函数。0 1 2 x F(x)第二节 常用的离散型随机变量的概率分布1.1.二项分布伯努利试验:许多试验只有两种互斥的结果,为了找到这些试验结果的规律性,需要在相同条件下做n n次独立重复试验,称为n n重伯努利试验,简称伯努利试验。二项分布 若在一次伯努利实验中成功(事件A发生)的概率为p(0p00,则称

16、X X服从参数为的泊松分布,记为XP()XP()。许多稀有事件都服从或近似服从泊松分布。=np=np。25.例5.已知某地区人群中患某种病的概率为0.001,试求在检查的5000人中至少有2人患此病的概率。解:由于n=5000较大,p=0.001较小,取=np=5,设X=患此病人数,则X P(5)若精确计算,则X B(5000,0.001)第3节 连续型随机变量的概率分布1.连续型随机变量的概率密度若对于随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数x,有:则称X为连续型随机变量,其中被积函数f(x)称为X的概率密度函数(简称概率密度)性质:f(x)0 f(x)0;对于任

17、意实数a,b(a 0)为常数,则称X服从参数为 ,2的正态分布(或高斯分布),记为XN(,2).特点:曲线f(x)呈钟形,关于直线x=对称,在(-,上递增,在,+)上递减。在x=处,f(x)取最大值 在x=处有拐点,且以x轴水平渐近线。28.当固定时,改变,则f(x)图形的形状不变,只改变其位置,确定图形的中心位置,称位置参数,增大,曲线向右移。当固定时,越小图形越陡峭,确定图形峰的陡峭形状,故称形状参数。29.标准正态分布参数=0=0,=1=1的正态分布为标准正态分布,记为XN(0,1)XN(0,1)。标准正态分布的重要性在于,任何一个正态分布都可以通过线性变换转化为标准正态分布。它的依据是

18、下面的定理:根据定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。30.正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的正态分布是概率论中最重要的分布。均匀分布、对数正态分布等分布不做要求。31.第4节 随机变量的数字特征随机变量数字特征,分两类:表示集中程度、平均水平数学期望、分位数、中位数、众数等;表示离散程度、变异大小方差、标准差、变异系数等。1.均数(数学期望)定义1:设离散型随机变量X X的分布律为P P X X=x xi i=p=pi i,k=1,2,3.,k=1,2,3.,则规定X X 的均数定义2 2:设连续

19、型随机变量X X的概率密度函数f(x)f(x),则规定X X的均数为性质:(1)(1)E E(c c)=)=c c,c,c为常数 (2)(2)E E(cXcX)=)=c c*E E(x x)(3)(3)E E(X XY Y)=)=E E(X X)E()E(Y Y)(4)(4)E E(XYXY)=)=EXEX*EYEY,X X与Y Y独立32.常见分布的数学期望二项分布:泊松分布:正态分布:E E(X X)=)=2.方差和标准差方差:设X X是一个随机变量,则称E E(X X-EXEX)2 2 为X X的方差,记作DXDX,为标准差。注:随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡

20、量取值离散程度的一个尺度。对于离散型随机变量:对于连续型随机变量:性质:(1)(1)D D(c c)=0)=0,c c为常数 (2)(2)D D(cXcX)=)=c c2 2*D D(X X)(3)(3)D D(X XY Y)=)=DXDX+DYDY,X X与Y Y相互独立33.常见分布的方差二项分布:泊松分布:正态分布:例7 7:设XP(2)XP(2),则下列结论中正确的是()A.EX=0.5,DX=0.5A.EX=0.5,DX=0.5B.EX=0.5,DX=0.25B.EX=0.5,DX=0.25C.EX=2,DX=4C.EX=2,DX=4 D.EX=2,DX=2 D.EX=2,DX=2例

21、8 8:相互独立的随机变量X X和Y Y的方差分别为4 4和2 2,则随机变量3X-2Y3X-2Y的方差是?3.变异系数比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。34.第5节 三种重要分布的渐进关系(略)当nn,二项分布B(k;n,p)B(k;n,p)以泊松分布P(k;)P(k;)为极限分布;当nn,二项分布B(k;n,p)B(k;n,p)以正态分布N(np,npq)N(np,npq)为极限分布;当nn,泊松分布P(k;)P(k;)以正态分布N(;)N(;)为极限分布。例:35.第3讲 随机抽样、抽样分布和总体的参数估计第1节 随机抽样1.1.总体与样本总体:研究对象的全体

22、,组成总体的每个单元称为个体。样本:在一个总体X X中抽取n n个个体X X1 1,X X2 2XXn n,这n n个个体组成的集合称为总体X X的一个样本。样本中含有个体的数目称为样本容量,也称样本的大小。简单随机抽样是指在抽取样本单位时,总体的每一个可能的样本被抽中的概率相同。简单随机样本样本X X1 1,X X2 2XXn n相互独立且与总体X X有相同的分布函数,这样的样本称为简单随机样本。36.第2 2节 样本的数字特征统计量:设X X1 1,X,X2 2XXn n为总体X X的一个样本,g(Xg(X1 1,X X2 2XXn n)为一个样本函数,如果g g中不含有任何未知参数,则称

23、g g为一个统计量。特点:(1)(1)统计量是样本中n个随机变量X1,X2,Xn的函数,它是完全由样本决定的量,仍是一个随机变量。(2)统计量不包含任何未知参数。例如:几种常见统计量样本均数37.样本方差、标准差、变异系数(相对标准差)注意:分母为n-1n-1。由于样本方差中的均数是样本的,是总体的一部分,其离差平方和一定变小,所以若以n为分母,S2一般比总体方差小(有偏估计)。而分母改为n-1后,经数学证明,S2总在总体方差周围波动(无偏估计),另外,S2 的自由度正好是n-1。样本的标准误SD与SE的区别:SD是描述个体观察值变异程度的大小,样本标准差越小,样本均 数对一组样本观察值的代表

24、性就越好;SE是描述样本均数变异程 度和抽样误差的大小,样本标准误越小,用样本均数估计总体均 数可靠性就越高。38.在实际中,一般用样本标准差与样本均数结合,用于描述样本观察值的分布范围;样本标准误与样本均数结合,用于估计总体均数可能出现的范围。第3节 抽样分布统计量是样本随机变量的函数,也是一个随机变量,因而也有自己的概率分布,这种统计量的分布叫做抽样分布。以下介绍几种在已知总体为正态分布条件下,常见统计量的抽样分布。1.1.样本均数的u u分布这说明样本均数的期望与总体的期望相等,而方差为总体方差的1/n倍。可见,用样本均值估计总体均值无系统偏差,且n越大越精确。39.样本均值分布的应用:

25、其标准化随机变量u主要用于单正态总体、方差已知、小样本条件下数学期望的u检验。40.2.2分布(卡方分布)设X1,X2,Xn相互独立,都服从N(0,1),则称随机变量:所服从的分布为自由度为n的 2分布,记为 2 2(n)。自由度:指统计量中独立变量的个数。计算公式为df=n-k,n为样本容量,k为约束条件个数。如统计量 ,变量独立无约束条件,所以自由度为n。而样本方差 ,其中有n个变量 ,但这说明变量间有一个约束条件,所以其自由度为n-1.性质:(1)一种非对称分布。当n较大时,曲线近似对称,趋于正态分布。(2)一个以自由度n为参数的分布族,自由度n决定了分布的形状,对于 不同的n有不同的分

26、布。(3)均值为n,方差为2n。41.定理:若X1,X2Xn为正态总体 的一个样本,则有3.t分布设XN(0,1),Y 2(n),且X与Y相互独立,则称随机变量 所服从的分布为自由度为n的t分布,记为tt(n)。性质:(1)t分布是对称分布,与标准正态分布相比,t分布的中心部分较低,2个尾部较高。(2)均值为0,方差为n/(n-2)。(3)当样本容量n较小时,t分布的方差大于1;当n逐渐增大时,t分布的方差就接近1,t分布也就趋近于标准正态分布。42.t t分布是统计学中十分重要的分布,应用最为广泛,其应用的依据是下面2 2个定理:(1)(1)设X1X1,X2XnX2Xn为正态总体 的一个样本

27、,则(2)(2)设X X1 1,X X2 2XXn1n1和Y Y1 1,Y Y2 2YYn2n2分别是从同方差的总体 和 中所抽取的样本,它们是相互独立,则 其中,S S1 1和S S2 2分别是这两个样本的标准差。43.4.F分布设X X 2(n1),Y 2(n2),X与Y相互独立,则称统计量 为服从自由度n1和n2的F分布,记为FF(n1,n2)。n1为分子随机变量X的自由度,称为分子自由度,n2为分母随机变量Y的自由度,称为分母自由度。性质:(1)非对称偏左侧的分布;当n较大时,曲线近似对称,趋于正态分布。(2)是以自由度n1和n2为参数的分布族,不同自由度决定了F 分布的形状。概率分布

28、的拟合及其应用不做要求。44.第4节 总体的参数估计统计推断:用样本的信息去推断总体的信息。参数估计:用样本统计量去估计总体参数的大小。假设检验:用样本统计量大小去推断总体参数是否有差异。45.1.参数点估计(略)直接用样本统计量大小代替总体参数。同一总体参数可用多个统计量来估计,衡量其好坏的指标有三个:无偏性、有效性、一致性。(易出选择题或填空题)缺陷:(1)点估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等 (总体参数本身是未知的)。(2)点估计值只是未知参数的一个近似值,没有给出它与真值之间的误差范 围(可靠程度),把握不大。实例:估计全省18岁女孩的平均身高。若根据实际样本,

29、通过点估计法可能得到 女孩的平均身高估计值为162cm。而实际上,女孩的平均身高可能大于或小 于162cm。若能给出一区间,能以较大概率相信这个区间包含身高的真值,将会更有价值。46.2 2、区间估计在给定可靠程度1-下,用样本值通过合适统计量,估计总体参数所在区间的方法。置信区间与置信度设是总体的未知参数,若由样本X1,X2,Xn 确定的两个统计量:对给定(050正态总体总体均数之差的区间估计、正态总体方差的区间估计(略)。离散型总体参数的区间估计不作要求。51.第4 4讲 总体参数的假设检验第1节 假设检验的基本思想问题的提出从吸烟人群和非吸烟人群中各抽取n=100n=100的样本,分别记

30、为A A样本和B B样本。A A样本收缩压为150mmHg150mmHg,B B样本为130mmHg130mmHg。原因有两种可能:(1)两个总体均数不相同 (2)抽样误差(两个总体均数相同)假设检验的基本思想(1)反证法(2)小概率原理:认为小概率事件在一次抽样中是不可能发生的。先假定一个假设H0:1=2成立,如果由此导出一个不合理现象的发生(即出现一个小概率事件),就拒绝这个假设;如果没有导出不合理的现象发生,就不能拒绝这个假设。52.假设检验的基本步骤(1)建立假设H0:1=2 (原假设)H1:12 (备择假设)注意:假设是针对总体,而不是样本(2)确定检验水准显著性水准,判定差别有无统

31、计学意义的概率水准,确定了小概率事件的标准。通常取=0.05。P -小概率事件(3)选定检验方法,计算检验统计量根据研究目的、资料类型选用合适的检验方法;统计量都是在H0成立的前提下算出来的!(4)确定P值根据检验统计量确定P值。53.P值:H0成立的概率如果P0.05,即H0成立的概率小于0.05,可以认为H0成立是小概率事件,发生的可能性很小,就有理由怀疑H0不成立!(5)做出推断结论推断的结论统计学结论专业结论P0.05,按=0.05检验水准,不拒绝H0,差异无统计学意义,还不能认为不同或不等。P0.05,按=0.05检验水准,拒绝H0,接受H1,差异有统计学意义,可以认为不同或不等。下

32、结论时,对H0只能说拒绝/不拒绝;对H1只能说接受!不拒绝H0 接受H0 54.第2节 单个正态总体的参数检验2 2已知时正态总体均值的u检验设总体XN(,2),X1,X2,Xn为抽自总体X的样本,方差2已知,则例1.某药厂正常情况下生产的某药膏含甘草酸量XN(4.45,0.1082).现随机抽查了5支药膏,其含甘草酸量分别为:4.40 4.25 4.21 4.33 4.46,若方差不变,问此时药膏的平均含甘草酸量是否有显著变化?(=0.05)解:H0:=0,H1:0;=0.05 根据显著水平=0.05,查正态分布双侧 临界值,得u u0.05/20.05/2=1.96=1.96|u|=2.4

33、85u u0.05/2 0.05/2,所以拒绝H0,接受H1。可以认为此药膏的平均含甘草酸量有显著性变化。55.2 2未知时正态总体均值的u检验设总体XN(,2),X1,X2,Xn为抽自总体X的样本,方差2未知,则例2.正常人的脉搏平均为72(次/min),现测得20例慢性四乙基铅中毒患者的脉搏(次/min)的均值是63.50,标准差是5.60,若四乙基铅中毒患者的脉搏服从正态分布,问四乙基铅中毒患者的脉搏是否与正常人不同?(=0.05)解:H0:=0,H1:0 =0.05查t分布临界值表得:|t|=6.7882.093,所以拒绝H0,接受H1可认为四乙基铅中毒者的脉搏与正常人不同。56.第3

34、节 两个正态总体的参数检验1.1.两个正态总体的方差齐性检验(略)2.2.配对比较两个正态总体均数的检验(略)3.3.成组比较两个正态总体均数的检验(略)第4节 方差分析在多组总体均数比较时如采用t检验会增大犯第一类错误概率。如三组之间的两两t检验,三组之间的两两t检验做完三次t检验,总的显著性水平变为1-(1-0.05)3=0.14,要大于设定的=0.05。而方差分析是将三组数据放在一起做一次比较,犯一类错误的概率仍为=0.05。基本概念试验指标:衡量试验结果好坏的标准。因素:在试验过程中,影响试验结果的条件。水平:因素在试验中可能处的状态。57.总体1.N(1,12)-样本1(n1,S1)

35、总体2.N(2,22)-样本2(n2,S2)总体3.N(3,32)-样本3(n3,S3)已知:12=22=32,问:1=2=3?总离差平方和(总离差平方和(SSSS),),所有观察所有观察值之间的差异值之间的差异组内离差平方和(组内离差平方和(SSeSSe),),在因素在因素的同一水平的同一水平(同一个总体同一个总体)内,样本内,样本的各观察值之间的差异的各观察值之间的差异组间利差平方和(组间利差平方和(SSSSAA),),在因素在因素的不同水平的不同水平(不同总体不同总体)下,各水平下,各水平的均值之间的差异的均值之间的差异 组间变异(不同药物效应引起+随机误差引起)总变异 组内变异(随机误

36、差引起)如不同药物的作用相同(H0:均值相等),则:F=组间变异/组内变异 =1在H0条件下,F虽不会正好等于1(抽样误差),但应当和1相差不大。F越大,其概率越小,当F以致其对应的概率P0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。59.方差分析的基本步骤(1)(1)提出假设H0:三种药物对小白鼠镇咳作用相同H1:三种药物镇咳作用不完全相同(2)确定检验水准 =0.05(3)计算统计量 SSe的自由度为N-k,即40-3=37,组内方差Se2=SSe/(N-k)SSA的自由度为k-1,即3-1=2,组间方差SA2=SSA/(k-1)统计量F=组间方差SA2/组

37、内方差Se2,将结果整理为方差分析表60.(4)(4)确定P P值 (5)(5)作出推断结论在=0.05水平上,拒绝H0,接受H1,认为三种药物平均推迟咳嗽时间不全相同。方差齐是方差分析的前提条件之一,因此先进行方差齐性检验(略)。方差分析中如果拒绝HO,接受H1,仅能认为多个水平间均数不全相等,但是哪些水平间差异显著,哪些不显著,方差分析不能作结论。因此需要进行两两间多重比较的检验法(略)。两因素试验的方差分析不作要求。第5节 离散型变量总体参数的假设检验单个总体率的假设检验(略)两个总体率的假设检验(略)61.第6节 列联表中独立性检验2222列联表(四格表)中的独立性检验原理及步骤(1)

38、建立假设 H0:两种药物治疗消化道溃疡的疗效相同 H1:两种药物治疗消化道溃疡的疗效不同(2)(2)确立检验水准=0.05=0.05(3)(3)计算统计量 在H0成立的前提下,假设1=2=PC(合计率),计算理论频数T两种药物治疗消化道溃疡4周后疗效处理愈合未愈合合计愈合率(%)洛赛克64(E11)21(E12)85 75.29雷尼替丁51(E21)33(E22)84 60.71合计115 54 169 68.0562.合计愈合率=115/169,合计未愈合率=54/169,各个格子理论频数应为:E11=85*115/169,E12=85*54/169,E21=84*115/169,E22=8

39、4*54/169统计学家Pearson提出对RC列联表使用统计量它服从自由度为f的 2分布,其中f=(R-1)*(C-1)。(4)确定P值。20.05,1=3.84,得P Fa时,则拒绝H0,即认为X与Y之间有显著的线性关系。72.第3节 预测与控制建立了有统计学意义的回归方程以后,X变量=x0时,Y变量为a+bx0,这个值是估计值,为提高可靠性,可以在进行区间估计,包括预测和控制(由x0推算y0称为预测,由y0推算x0称为控制)。(略)多元线性回归与非线性回归不做要求。第4节 半数有效量(ED50)和半数致死量(LD50)估计概率单位法(略)序贯法不做要求。73.第6 6讲 正交试验设计对于

40、单因素或两因素试验,因其因素少,试验的设计、实施与分析比较简单。但在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。第1节 正交表与交互作用基本原理正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。例如,要考察乙醇浓度、溶剂用量和浸渍速度对姜黄素提取收率的影响。每个因素设置3个水平进行试验。74.A因

41、素是乙醇浓度,设A1、A2、A3 3个水平;B是溶剂用量,设B1、B2、B3 3个水平;C因素为浸渍速度,设C1、C2、C3 3个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能组合有27种。全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多,工作量大,在有些情况下无法完成。若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。本例,3个因素的选优区可以用一个立方体表示(图1),3个因素各取3个水平,把立方体划分成27个格点,反映在

42、图上就是立方体内的27个“.”。若27个网格点都试验,就是全面试验,其试验方案如表1所示。75.76.正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图1中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1 (2)A2B1C2 (3)A3B1C3(4)A1B2C2 (5)A2B2C3 (6)A3B2C1(7)A1B3C3 (8)A2B3C1 (9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。从图1中可以看到,9个试验点在选优区中分布是均衡的,

43、在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。77.9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。正交表L8(27),其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素。78.正交表的正交性(1)任一列中,各水平都出现,且出现的次数相等;(2)任两列之间各种不同水平的所有可能组合都出现,且对出现的次数相等;交互作用在多因素试验中,不仅因素对指标有影响,而且因素之间的联

44、合搭配也对指标产生影响。因素间的联合搭配对试验指标产生的影响作用称为交互作用。第2 2节 用正交表安排试验(不考虑交互作用)实例:为提高穿心莲内酯的提取收率,根据实践经验,对工艺中4 4个因素各取两个水平进行考察。(1)明确试验目的,确定试验指标对本试验而言,试验目的是为了提高穿心莲内酯的收率,所以试验指标为收率。79.(2)选因素、定水平,列因素水平表对本试验分析,影响穿心莲内酯收率的因素很多,经全面考虑,最后确定乙醇浓度、溶剂用量、浸渍温度和浸渍时间作为本试验的试验因素,分别记作A、B、C和D,进行四因素正交试验,各因素均取两个水平,因素水平表如下。(3)选择合适的正交表正交表的选择原则是

45、在能够安排下试验因素和交互作用的前提下,尽可能选用较小的正交表,以减少试验次数。80.此例有4个2水平因素,可以选用L L8 8(2(27 7)或L L1212(2(21111);因本试验仅考察四个因素对液化率的影响效果,不考察因素间的交互作用,故宜选用较小的L8(27)正交表。(4 4)表头设计是指把试验因素和要考察的交互作用分别安排到正交表的各列中去的过程。在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按所选正交表的交互作用列表安排各因素与交互作用,以防止设计“混杂”。本例不考察交互作用,可将乙醇浓度(A)(A)、溶剂用量(B)(B)、浸渍温度(C)(C)、浸渍时间(D

46、(D)随机安排在L L8 8(2(27 7)的列上。(5 5)编制试验方案,按方案进行试验,记录试验结果。把正交表中安排各因素的列(不包含欲考察的交互作用列)中的每个水平数字换成该因素的实际水平值,便形成了正交试验方案。81.说明:试验号并非试验顺序,为了排除误差干扰,试验中可随机进行;安排试验方案时,部分因素的水平可采用随机安排。(6)试验结果的数据分析直观分析正交试验结果的分析,要解决如下三个问题:一是确定因素各水平的优劣,二是分析因素的主次,三是确定最佳试验方案。82.因素主次:因素极差越大,说明因素的水平改变对试验结果影响也越大,表明该因素对试验指标的影响越重要。所以,因素的主次顺序为

47、:CBDACBDA。最佳试验方案:A1B1C2D2A1B1C2D283.第3节 用正交表安排试验(考虑交互作用)实例:前面的例子中,如果除了考察A,B,C,D4个因素外,还要考察交互作用AB,AC,BC,试寻找最佳工艺条件。对有交互作用的试验,表头设计时因素不能任意安排,必须选择正交表的交互作用附表并按照此表把因素和交互作用安排在合适的列上,不能使不同的因素或交互作用同处一列,以避免造成混杂。一般先安排涉及交互作用多的因素,然后安排涉及交互作用少的,最后安排不涉及交互作用的。本例中应选择L L8 8(2(27 7)的交互作用附表,如下:84.AC,BC的R值很小,可以认为是误差引起的。AB的值

48、很大,超过了A、B的单独作用,这是必须考虑A和B水平的最优搭配。可列出下面的二元表:85.A A和B B的4 4种搭配中,A2B1A2B1收率最高,于是,当有交互作用存在时,最佳试验方案应为A2B1C2D2A2B1C2D2。这个试验方案在所安排的8 8次试验中是没有的,这说明用正交表安排试验,虽然只做了全面试验的一部分,但也不会漏掉好的试验方案。试验结果的方差分析不作要求。例:用L8L8(2727)表安排试验,如果考虑到3 3个因素A,B,CA,B,C和它们的交互作用AB,AB,AC,BCAC,BC,则因素C C应该排在那一列()A.3 B.4A.3 B.4C.6 D.7C.6 D.7【答案】B B【解析】依据L8L8(2727)的交互作用附表,第1 1、2 2列应安排A A、B B因素,第3 3列应安排AB,AB,因素C C安排在第4 4列。86.祝同学们学习愉快!87.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 行业资料 > 医药制药

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服