第四章统计推断.doc_咨信网zixin.com.cn

资源描述

第四章统计推断抽样试验的根本目的在于根据样本的统计量推断其相应总体的本质特征，即从一个样本或一系列样本所得的结果去估计总体的参数，这称为统计推断，它包括参数估计和假设测验两个方面。参数估计有点估计和区间估计，前者是用样本平均数()作为总体平均数()的估计值，而后者则是估计未知总体参数的取值范围。假设测验又称显著性测验，是通过一定的方法来检验参数估计的可靠性。第一节统计假设测验一、基本概念 (一)、统计假设例4.1 设某地区的当地小麦品种一般亩产300kg，并根据多年种植结果获得其标准差为75㎏，现引进某新品种通过25个小区的试验，得到其平均亩产为330㎏，问(1)新品种与当地品种是否有显著差异？(2)新品种是否比当地品种增产？对例4.1的试验结果进行分析，新品种每亩产量为330㎏，而当地品种每亩产量为300㎏，从表面上看，新品种似乎比当地品种每亩增产30㎏，但这种增产可能是由于两种原因引起的：一是新品种本身比当地品种产量高(在品种遗传特性上)，二是由于误差引起的。但到底是何种原因引起的，在统计学上首先提出一个有关总体参数的假定，即统计假设。 1. 单个样本平均数的假设假设一个样本是从具有平均数为μ的总体中随机抽出的，并且总体平均数μ和某一定值μ0相等，记作H0：μ=μ0，即本例中假定新品种是从当地品种中抽出的一个样本，μ=300。 2. 两个样本平均数的假设假设两个样本是从两个平均数相等的总体中随机抽出的，记作H0：μ1=μ2。上述假设称无效假设，即处理没有效应，某一处理的总体平均数(μ)与对照(此处的对照并非指试验中设置的对照，而是指当地多年生产的实际情况)的总体平均数()或两个处理的总体平均数(μ1和μ2)相同，试验结果的差异实质上是由误差引起的。与无效假设相对应的另一个统计假设称备择假设或对应假设。根据测验目的不同，备择假设分为三种情况：一是某一处理的总体平均数与对照的总体平均数不相同(有显著差异)或两个处理的总体平均数不相同，此时分别记作HA：μ≠μ0或HA：μ1≠μ2；二是某一处理的总体平均数大于对照的总体平均数或某一处理的平均数大于另一个处理的平均数，此时分别记作HA：μ>μ0或HA：μ1>μ2；三是某一处理的总体平均数小于对照的总体平均数或一个处理的总体平均数小于另一个处理的总体平均数，此时分别记作HA：μ<μ0或HA：μ1<μ2。通过假设测验，如果否定了无效假设，则必然接受备择假设；相反，如果肯定了无效假设，则必然否定备择假设。 (二)、显著水平指统计假设测验中所用的概率标准，又称显著水准，常用α表示。根据“小概率事件实际不可能性原理”，在统计分析中常用α=0.05或α=0.01作为田间试验的概率标准，其中前者称显著水平，而后者称极显著水平。根据测验结果，如果试验结果的差异单纯由误差引起的概率小于或等于0.01，则表示两者之间有真实差异或一个总体的平均数大于另一个总体的平均数或小于另一个总体的平均数的概率在0.99以上，称差异极显著或有极显著差异；如果试验结果的差异单纯由误差引起的概率在0.05～0.01之间，则表示两者之间有真实差异或一个总体的平均数大于另一个总体的平均数或小于另一个总体的平均数的概率在0.95～0.99，称差异显著或有显著差异；如果试验结果的差异单纯由误差引起的概率大于0.05，则表示两者之间有本质差异或一个总体的平均数大于另一个总体的平均数或小于另一个总体的平均数的概率在0.95以下，则不能判定试验结果的差异到底是误差引起还是由真实差异引起，此时为了降低生产上盲目应用的风险，在统计学一般认定为此种结果差异是由误差引起的，称差异极不显著或无显著差异。由于统计假设测验是用差异显著或差异不显著来表示测验结果的，因此又称显著性测验。如果测验结果差异显著或极显著，则否定H0而接受HA；相反，如果测验结果差异不显著，则接受H0而否定HA。 (三)、一尾测验和两尾测验如图4.1所示，如果备择假设只有一种可能HA：μ>μ0或HA：μ1>μ2，则H0的否定区域只有概率曲线的右边一尾，称右尾测验；同样如果HA：μ<μ0或HA：μ1<μ2，则H0的否定区域只有概率曲线的左边一尾，称左尾测验，这种否定区域只涉及到概率曲线的左边或右边一尾的假设测验称一尾测验；相反，如果HA：μ≠μ0或HA：μ1≠μ2，则H0的否定区域有两种可能性，此时概率曲线的否定区域在曲线两边各取一半，称两尾测验。在田间试验和统计分析上，适合用一尾测验的条件有： 1. 在理论上，如果某一处理的试验指标只可能比对照或另一处理的高或低时，用一尾测验，只可能高时用右尾测验，而只可能低时则用左尾测验。 2. 在实践上，如果某一处理的试验指标只有在比对照或另一处理的高或低才有应用价值时，也可用一尾测验，同样前者用右尾测验，后者用左尾测验。而试验的目的如果仅是分析某一处理与对照间或两个处理间有无显著差异，则用两尾测验。如图4.1所示，由于两尾测验的标准要比一尾测验的标准高(即临界值要大)，因此在实际试验中，大多数均采用两尾测验，可防止盲目应用所带来的风险。 (四)、u测验和t测验根据抽样分布的规律和特点，从一个平均数为μ、方差为σ2的正态总体中抽样，或者在一个非正态总体里抽样只要样本容量足够大，则所得一系列样本平均数的分布必趋向正态分布，具有N(μ，)，并且遵循正态分布N(0，1)。但其只有在总体方差σ2已知或σ2虽未知但样本容量相当大，可用s2直接作为σ2的估计值时才有如此特点。如果样本容量不太大(n<30)而σ2未知时，若以s2估计σ2，则标准化离差的分布不呈正态而是与自由度df=n-1有关的t分布。因此，当总体方差已知或属于大样本时，一般用u测验；而当总体方差未知又属于小样本时，则只能用t测验。二、统计假设测验的基本方法 (一)、建立统计假设即根据测验目的和要求，写出无效假设和对应的备择假设。如果为单个样本平均数的假设测验，则H0：μ=μ0和HA：μ≠μ0(两尾)或H0：μ=μ0和HA：μ>μ0(右尾)或H0：μ=μ0和HA：μ<μ0(左尾)；如果为两个样本平均数的假设测验，则H0：μ1=μ2和HA：μ1≠μ2(两尾)或H0：μ1=μ2和HA：μ1>μ2(右尾) 或H0：μ1=μ2和HA：μ1<μ2(左尾)。例如例4.1中先假定当地品种的每亩产量为μ0 =300㎏，新品种的每亩产量为μ，则有(1) H0：μ=μ0=300㎏，即新品种和当地品种的产量相同和HA：μ≠μ0，即新品种与当地品种在产量上有显著差异；(2) H0：μ=μ0=300㎏，即新品种和当地品种的产量相同和HA：μ>μ0，即新品种比当地品种增产。在建立统计假设时，应以文字描述的方式说明其所代表的具体含义，以免引起误解。 (二)、选取显著水平根据试验目的确定选取显著水平(α=0.05)还是极显著水平(α=0.01)。如果试验结果对生产的影响较大，盲目应用可能会造成较大的损失，则宜用极显著水平；如果试验结果对生产的影响不大，一般不大可能引起较大的损失，则宜用显著水平。如果试验目的要求测验有没有显著的差异，则用显著水平；如果试验目的要求测验有没有极显著差异，则用极显著水平。 (三)、确定测验方法，进行显著性测验 1. 当总体方差已知或总体方差未知但属于大样本时，用u测验 (单个样本) 或 (两个样本) 由此可以看出，因为统计假设测验是在无效假设H0的基础上进行的，并且μ或μ1和μ2未知，因此只有假定μ为某一已知的值μ0或μ1=μ2时才能计算出相应的u值进而才能进行测验，因此在统计假设的建立中，“=”号必须在H0中，t测验也是如此。当u值计算出来后，根据选取的α值，查教材P359附表3查出对应的uα临界值。需要注意的是，由于附表3是两尾表，如果要进行一尾测验，则需先将α×2得到2α值再查附表3。 2. 当总体方差未知且属于小样本时，用t测验 (单个样本) 或 (两个样本) 然后根据或或有效自由度和选取的α值，查教材P360附表4查出对应的tα临界值。同样，由于附表4也是两尾表，如属一尾测验，需将α×2得到2α值再查表 (四)、进行统计推断用计算出来的u值或t值与附表中查出的uα或tα进行比较，从而决定否定无效假设或接受无效假设。当或，否定H0，接受HA；当或，则接受H0而否定HA。三、统计假设测验的两类错误由样本的结果进行假设测验而作出统计推断时，可能会作出错误的判断。一般统计假设测验可能有两种错误，如表4.1。表4.1 统计假设测验的两类错误测验结果如果H0是正确的如果H0是错误的如果H0被否定第一类错误没有错误如果H0被接受没有错误第二类错误如果显著水平过低(α值过大)会增加犯第一类错误(错误)的机会，如果显著水平过高(α值过小)则会增加犯第二类错误(错误)的机会。两类错误有如下关系： 1. 在样本容量n固定的情况下，提高显著水平(取较小的α值)，如从α=0.05提高到α=0.01，会增大犯第二类错误的概率。 2. 在n和α固定的情况下，总体平均数μ和假设平均数μ0的差值越大(以标准误为单位，即)，犯第二类错误的概率越小。 3. 为了降低犯两类错误的概率，需要采用较低的显著水平，如α=0.05，同时适当增加样本容量n，或适当减少总体标准差σ。 4. 如果显著水平α已固定，则改进试验技术和增加样本容量n可以有效地降低犯两类错误的概率。第二节平均数的假设测验一、单个样本平均数的测验单个样本平均数假设测验的理论基础是样本平均数的分布。 (一)、当总体方差已知或总体方差未知但属于大样本时，用u测验例4.1 设某地区的当地小麦品种一般亩产300kg，并从多年种植结果获得其标准差为75㎏，现有某品种通过25个小区的试验，其平均亩产为330㎏，问新品种与当地品种是否有显著差异？解：以μ表示新品种的亩产量，以μ0表示当地品种的亩产量(没有显著差异)。 (1)H0:μ=μ0=300㎏，即新品种小麦亩产量与当地品种的亩产量相同。 HA:μ≠μ0，即新品种与当地品种的亩产量有显著差异。 (2) 根据测验目的要求，取α=0.05 (3) 根据题意，总体方差为σ2=752已知，故用u测验。查附表3，得 (4) 因此有，因此接受HA，否定H0，即该小麦新品种与当地品种的亩产量有显著差异。例4.2 某一红星苹果以磷细菌肥料进行处理试验，以红星苹果可溶性固形物在当地经历年测验，平均数9.57%为对照，果实采收后随机抽取用磷细菌肥料处理的果实100个测定其可溶性固形物含量，得其平均数为11.99%，标准差为1.3%，试问磷细菌肥料处理能否极显著提高红星苹果的可溶性固形物含量？解：以μ表处理的后的红星苹果的可溶性固形物含量，而以μ0表示对照。则根据测验目的的要求，有： (1) H0:μ=μ0=9.57(%)，即磷细菌肥料处理并不能提高红星苹果的可溶性固形物含量； HA：μ>μ0，即磷细菌肥料处理能显著提高红星苹果的可溶性固形物含量。 (2) 根据测验目的，取α=0.01 (3) 从题意中可知，总体方差未知但样本容量n=100，属于大样本，因此用u测验。根据HA的假定，本测验属于一尾测验，故u0.01=2.33 (4)因此，故否定H0，接受HA，即磷细菌肥料处理能极显著提高红星苹果的可溶性固形物含量。 (二)、当总体方差未知且又属于小样本时，用t测验例4.3 种在受污染地区的小麦千粒重为36.0g，随机抽取未受污染地区10个点的小麦千粒重分别为38.0，37.0，39.0，38.0，39.0，38.0，39.0，36.0，38.0，37.0。问污染与无污染地区的小麦千粒重有无显著差异？解：以μ代表未受污染地区的小麦千粒重，而以μ0表示污染地区的小麦千粒重。从测定结果中可以算出： (1) H0：μ=μ0，即两种地区的小麦千粒重没有显著差异； HA：μ≠μ0，即两种地区的小麦千粒重有显著差异。 (2) 根据试验目的的要求，取α=0.05 (3) 由于总体方差未知且n=10属于小样本，因此用t测验。根据查附表4，得 (4) 因此，故接受HA，否定H0，即两种地区的小麦千粒重有显著差异。二、两个样本平均数相比较的假设测验两个样本平均数相比较的假设测验的理论基础是亲本平均数差数分布。 (一)、成组数据资料的比较成组数据：两个处理按完全随机设计的方式所获得的数据资料称成组数据资料。 1. 当两个样本的总体方差和均已知或两个样本都属于大样本时，用u测验例4.4 含有甲、乙两个柑橘品种，其株数、平均株产和标准差表4.2，问两个品种间的单株产量是否有显著差异？表4.2 甲、乙两个柑橘品种平均株产和标准差品种株数平均株产(㎏) 标准差(㎏) 甲 400 66.7 5.6 乙 400 75.2 6.2 解：从表4.2中可以看出，n甲=n乙=400，故尽管甲、乙两个品种的平均株产的总体方差均未知，但都属于大样本，因此用u测验。 (1) H0：，即甲、乙两个品种的平均株产相同； HA：，即甲、乙两个品种的平均株产有显著差异。 (2) 根据测验目的要求，取α=0.05 (3) 查附表2， (4) 因此，因此接受HA，否定H0，即甲、乙两个品种的平均株产有显著差异。 2. 当两个样本的总体方差σ12或σ22均未知且其中至少一个属于小样本，同时可以假定σ12=σ22=σ2，用t测验此种方法的关键条件是σ12=σ22，在统计学上判断σ12=σ22或σ12≠σ22一般通过F测验来进行检验，即，其中大值均方为均方值较大的样本的均方，而小值均方则为均方值较小的样本的均方。当，则σ12≠σ22；，则σ12=σ22。注：F0.025为α=0.05的α/2值。因为F临界值表属于一尾表，而此处理的F测验为两尾测验。首先计算两样本均方的加权平均数作为共同总体方差的估计值。称为混合方差或合并均方。然后再计算标准误，即：再计算t值，即：最后根据查附表4查出临界值进行比较。例4.5 某辣椒品种在A、B两地栽培的小区产量如下表，试分析两地的产量有无显著差异？表4.3 某辣椒品种A、B两地小区产量试验地小区产量 (㎏) A 12.6 13.4 11.9 12.8 13.6 B 13.1 13.4 12.8 13.5 13.5 12.7 12.4 解：由表4.3中试验结果可以算出： (1) H0：μA=μB，即该辣椒品种在A、B两地的小区产量相同； HA：μA≠μB，即该辣椒品种在A、B两地的小区产量有显著差异。 (2) 根据试验目的的要求，取α=0.05 (3) 由于均属于小样本，故查表得F0.025=6.23(注：该值在本课程教材的附表中查不到，可利用其它统计学教程的有关附表查找，也可根据，如果F≥F0.01则必然有F>F0.025，如果F≤F0.05则必然有F<F0.025的逻辑关系判断，从本课程教材P361附表5中可查出F0.01=9.15，F0.05=4.53) ∴ F<F0.025，故，因此用t测验根据查附表4，t0.05=2.228 (4)因此，故接受H0而否定HA，即该辣椒品种在A、B两地的小区产量没有显著差异。 3. 当两个样本的总体方差σ12或σ22未知且其中至少一个属于小样本，同时可以假定 σ12≠σ22，用近似t测验根据F测验的结果，如果F≥F0.025，则σ12≠σ22，此时样本平均数差数的分布不再准确地服从于的t分布而是服从于有效自由度的t分布，在进行显著性测验时需进行有效自由度的计算，用近似t测验。然后根据查附表4查出tα值。，例4.6 (教材P85例5.5)测定冬小麦品种东方红3号的蛋白质含量(%)10次，得=14.3，；测定农大139号的蛋白质含量5次，得=11.7，，试测验两品种蛋白质含量的差异显著性？解：(1)H0：μ1=μ2，即两品种蛋白质含量相同； HA：μ1≠μ2，即两品种蛋白质含量有显著差异。 (2) 取α=0.01 (3) 查表可得，故，因此，因此用近似t测验。根据≈12查附表4得t0.01=3.06. 因此，故否定H0而接受HA，即两品种蛋白质含量有极显著差异。 (二)、成对数据资料的比较两个处理按随机区组设计的方式所获得的数据资料成成对数据资料。在成对数据资料中，每一区组内的两个样本平均数相减可以消除非试验因素的影响，从而更容易控制土壤差异或其它环境条件的差异。在统计分析上，先求每一对观察值的差值，然后再求差值的平均值和，再根据是否是大样本还是小样本确定用u测验还是t测验。例4.7 A、B两个菠菜品种在10块地段上进行配对设计，获得的小区产量如表4.4，问两品种的产量是否有显著差异？表4.4 A、B两菠菜品种小区产量(㎏) 试验地段品种A 品种B 差值d 1 29.3 20.4 8.9 2 21.3 20.2 1.1 3 30.7 20.1 10.6 4 30.2 23.4 6.8 5 36.4 23.7 12.7 6 37.4 19.3 18.1 7 35.6 25.1 10.5 8 27.8 18.7 9.1 9 24.7 17.4 7.3 10 36.3 29.6 6.7 Σ 309.7 217.9 91.8 解：由于该试验采用配对设计，因此宜用成对数据资料进行分析。经计算有： (1) H0：μA=μB(或μd=0)，即两菠菜品种的产量无显著差异； HA：μA≠μB(或μd≠0)，即两菠菜品种的产量有显著差异。 (2) 根据试验目的，取α=0.05 (3) 由于是小样本，因此用t测验。根据查附表4，得 (4)因此，故否定H0而接受HA，即两菠菜品种的产量有显著差异。第三节百分数的假设测验许多田间试验结果是用百分数或成数表示的，如发芽率、坐果率、杀虫率、萌发率、病株率等等。这些百分数由某一属性的个体计算求得，属二项百分数资料，与上述连续性变数资料不同，属间断性变数资料。这类百分数（或成数）的显著性测验，理论上应按二项分布进行，即从二项式展开来求出某项属性个体百分数的概率。但是如果样本容量 n 较大， p、q 都不过分小，而 np、nq均不小于 5 时，的分布就接近于正态分布。因而可以将百分数资料作正态分布处理，从而作出近似的测验。其测验的方法与上述平均数测验方法相似。但应注意由于这类二项百分数的分布是间断性的二项分布，若把它当作连续性的分布来处理，其结果会有出入，并且容易增大犯第一类错误的概率，所以在进行显著性测验时，需要作连续性矫正。适合于 u 测验所需的二项样本容量 n 见表4.5 。表4.5 适合于正态离差测验的 n和 n 值表（样本百分数） n （较小组次数） n （样本容量） 0.50 15 30 0.40 20 50 0.30 24 80 0.20 40 200 0.10 60 600 0.05 70 1400 一、单个样本百分数的假设测验即测验一个样本百分数的总体百分数 P 与某一理论值或期望值的差异显著性。 1. 适于u测验并且不需作连续性矫正的测验方法满足表4.5条件，同时 np 和 nq 都大于30 ，则可不进行连续性矫正，直接采用u测验。，例4.8 在遗传试验上，以缺裂叶番茄品种与薯叶番茄品种杂交。在 F2的 500 株番茄植株中，呈缺裂叶的有390株，薯叶的有110株。如果叶形这一性状受一对显隐性等位基因控制，则根据遗传学原理， F2代缺裂叶植株与薯叶植株的分离比应为3：1 ，即缺裂叶番茄植株理论百分比=0.75 ，薯叶植株理论百分比=0.25 。试测验该试验结果是否符合一对等位基因的遗传规律？解：假设：番茄叶形遗传符合一对等位基因的遗传规律，：p==0.75 ；对：。显著水平 a =0.05 ，作两尾测验。因np 和 nq 都大于 30 ，故直接用 u 测验。测验计算：因为实得，故 P>0.05 。推断：接受番茄叶形遗传符合一对等位基因的遗传规律，试验所得缺裂叶番茄植株百分比=0.78 和=0.75 的差异属随机误差。 2. 适于u测验但需作连续性矫正的测验方法如果np 和nq 都大于5，同时np 或nq小于30 ，可以采用u测验，但需要进行连续性矫正。，如果试验资料为次数的，则：，例4.9 随机调查实生的银杏树 23 株，其中雌株 10 株，雄株 13 株，问银杏雌雄株的比例是否为 1：1？解：假设：银杏雌雄株的比例为1 ：1 ，即：p=q=0.5 ；：p ≠ 0.5 显著水平 a =0.05 ，两尾测验。测验计算：已知理论值 p=q=0.5，故5<np=nq=23×0.5=11.5<30，因此用连续性矫正的u测验。，现，所以 P>0.05 。推断：接受，此试验结果的实生银杏雌雄株的比例符合1：1 。 3. 连续性矫正的t测验方法当np或nq小于5时，需用经连续性矫正的t测验法。，如果试验资料为次数的，则：，二、两个样本百分数的假设测验测验两个样本百分数和所属的总体百分数和的差异显著性。 1. 适于u测验并且不需作连续性矫正的测验方法当两个样本的 np 和 nq 都大于 30 时可采用不作连续性矫正的u 测验(判断用的和是用和进行的)。如果两个样本的总体百分数和都已知，则有：，如果两个样本的总体百分数或都未知，在能假定的条件下，有：，其中例4.10 在砀山酥梨疏花疏果试验中，用 A 、 B 两种药剂在酥梨的盛花期进行喷洒，用 A 药剂喷洒 675 朵花，其中坐果的为 72 朵； B 药剂喷洒 820 朵，坐果的为 89 朵，问 A 、 B 两种药剂对砀山酥梨疏花疏果的效果是否一致？解：假设： A、B 两种药剂对酥梨疏花疏果的效果一致，即；。显著水平 a =0.05 ，进行两尾测验。，由于，，在下，有，因此有 ∵ ，，故用u测验 =1.96 ，故 P>0.05 。推断：接受，A、B 两种药剂对砀山酥梨疏花疏果的效果一致。 2. 适于u测验但需作连续性矫正的测验方法如果np 和 nq 都大于 5并且 np或nq小于30时采用矫正的 u 测验(判断用的和是用和进行的)。，其中，为较大的样本百分数，为较小的样本百分数。例4.11 在超低温保存苹果离体茎尖的研究中，用玻璃化法保存红富士苹果茎尖 20 个()，存活 14 个，用包埋干燥法保存 25 个()，存活 19 个，问两种超低温保存红富士苹果离体茎尖的存活率有无显著差异？解：假设：两种处理方法对保存红富士苹果离体茎尖的存活率无显著差异，即；。显著水平 a =0.05 ，进行两尾测验。，由于，，在下，有，因此有 ∵ ，，用矫正u测验现=1.96 ，故 P>0.05 推断：接受，两种处理方法对保存红富士苹果离体茎尖的存活率无显著差异。 3. 连续性矫正的t测验方法如果np 或 nq 小于 5 ，可用 t 测验并进行连续性矫正，按查表。(判断用的和是用和进行的) ，其中，为较大的样本百分数，为较小的样本百分数。第四节参数的区间估计一、基本概念 1. 区间估计：指在一定的概率保证下，通过样本统计数估计出来的总体参数的取值范围。 2. 置信度：保证置信区间能覆盖参数的概率，又称置信系数，以P=1-α表示。 3. 置信区间：指总体参数区间估计的取值范围。置信区间的上、下限称为置信限，一般分别以L1表示下限，L2表示上限。 4. 置信距：指置信区间的长度，即上限与下限的差值。 5. 置信半径：即置信距的一半。二、区间估计方法 (一)、总体平均数μ的区间估计 1. 在总体方差σ2已知时参数区间估计的基本原理是统计假设测验中接受H0的条件，以单个总体平均数μ为例，在总体方差σ2已知时，接受H0的条件为：即：， 2. 在总体方差σ2未知时 (大样本) (小样本) (二)、两总体平均数差数(μ1-μ2)的区间估计 1. 在两总体方差均已知或均为大样本时或 2. 在两总体方差未知又属于小样本时 2.1 成组数据 2.1.1 可以假定两总体方差相等 2.1.2 可以假定两总体方差不相等其中：，， 2.2 成对数据即 3. 二项总体百分数p的区间估计如果资料满足不需要矫正的u测验的条件，可以正态分布来估计。即：如果不满足以上条件，则由相应的方法可以推算出来。 4. 两个二项总体百分数差数()的区间估计如果资料满足不需要矫正的u测验的条件，可以正态分布来估计。即，其中第五节样本容量在对总体参数进行估计，常要求所获得的估计值与其真值之间相差不超出某一个范围。根据抽样分布与原总体分布之间的关系来确定合理的样本容量。由于在参数估计中最适合的抽样分布是正态分布，因此可以根据u测验的方法来初步确定一个样本容量，然后根据该样本容量采用t测验的方法去估计一个新的样本容量，如此反复，直到所估计出来的样本容量稳定为止。而估计值与其真值之差的绝对值也就是置信半径。一、估计总体平均数时样本容量的确定假定以±d来表示总体平均数的估计值与其真值之间的差异范围，则在置信度p=1-α下，有：，即或，即然后根据，查值表，代入，得到一个新的，再根据该重查值表，代入上式，直到稳定为止。例4.12 假定从2hm2小麦田内随机抽到10个测框每框1m2的样本，经脱粒计产得(50g/m2)，(50g/m2)，试问若要保证95%以上的可靠性使所获得的产量与其总体产量之差不超过±1.0(50g/m2)，则样本容量至少应该达到多少？解：根据题意，有：，，由于，所以，则 (注意：取整时要进一位以保证概率要求) 根据，查值表，代入再根据查值表，代入再根据查值表，代入由于不再变动，因此要保证95%以上的可靠性使所获得的产量与其总体产量之差不超过±1.0(50g/m2)，则样本容量至少应该达到14。二、估计两总体平均数之差时样本容量的确定，即或，即三、估计二项总体平均数时样本容量的确定，即或，即四、估计两二项总体平均数之差时样本容量的确定，即或，即 - 56 -

展开阅读全文