收藏 分销(赏)

生物统计学课件:第2章 资料的整理与特征数的计算.pdf

上传人:曲**** 文档编号:229921 上传时间:2023-03-20 格式:PDF 页数:163 大小:10.90MB
下载 相关 举报
生物统计学课件:第2章 资料的整理与特征数的计算.pdf_第1页
第1页 / 共163页
生物统计学课件:第2章 资料的整理与特征数的计算.pdf_第2页
第2页 / 共163页
生物统计学课件:第2章 资料的整理与特征数的计算.pdf_第3页
第3页 / 共163页
生物统计学课件:第2章 资料的整理与特征数的计算.pdf_第4页
第4页 / 共163页
生物统计学课件:第2章 资料的整理与特征数的计算.pdf_第5页
第5页 / 共163页
点击查看更多>>
资源描述

1、第二章数据的整理与分析2试验资料的整理2.1 原始数据的录入通过调查与试验,取得原始资料,输入计算机 excel表格。例1:为了调查马氏珠母贝的生长 情况,测量某养殖场三笼马氏珠母贝的总重(g),共获得128个数据,结果如下表。2试验资料的整理2.1原始数据的输入通过调查与试验,取得原始资料,输入计算机 excel表格。例1:为了调查马氏珠母贝的生长 情况,测量某养殖场三笼马氏珠母贝的总重(g),共获得128个数据,结果如下表。三笼马氏珠母贝的总重(g),共获得128个数据5 1.98p62.57/48.80-34.0h35.80-48.50-42.3038.72/52.3%24.0247.6

2、444.3L39.67.38.2852.0848.回53.9847.78.44.4%37.72-61.6836.9926.4954.5235.6750.7654.3446.4539.9654.07-45.7755.8655.7848.8036.7731.8251.8937.7844.8150.3%31.55。76.77。36.06,46.8h42.65户46.47.34.73.50.1L49.8849.39-46.34+62.3958.8863.S648.0251.3345.5155.68.42.25.41.8749.1858.9242.0039.6846.7153.8548.7846.003

3、8.7043.66/33.36.45.08*32.32.45.7033.76“50.57.27.36,55.47.57.7L45.32-40.9442.6558.5235.52小57.5L54.57,52.33,62.2%55.IL46.0652.8146.4741.1631.8351.9657.5965.0728.9656.8355.97-37.4037.3935.6540.7039.9353.1422.7021.4435.444132.8348.0542.4742.12,39.3833.44-31.15.29.8730.22,31.85-37.2745.9734.8037.0833.173

4、0.9220.4723.45p在一列中输入数据,其中第一行输 入标题“总重(g)”(图)。E Microsoft Excel-data回文件(E)编辑 视图笆)插入 格式(。)工具 数据)窗口 帮助-=j j ia aa川受微x上心人 一 z M 他出wo%工,LITABCDEFGHI1总重51.98LL62.57448.80LL34.01LL35.80LJ _48.50LL42.30LL38.721052.311124.02li L47.64I13_44.31ll_39.67在一列中输入数据,其中第一行输 入标题“总重(g)”(图)。11831.1511929.8712030.2212131

5、.8512237.2712345.9712434.8012537.0812633.1712730.9212820.4712923.451301312.2绘制频数分布图频数分布图是直观反映数据分布情况的一种 常用方法。将数据按照一定的规则分成不同 的组,组数用上表示;同一个组中的数值属于 同一范围,组内包含的个体个数称为频数(/);总频数或样本容量可用公式表示为,胸率 为f/n。以128个马氏珠母贝壳高测量值为例,制作 频数分布表与频数分布图。编制连续型数据的频数分布图的一般步骤是:2.2.1 Excel(1)确定极差R从原始数据中找出最大值max(x)和最小值 min(x),计算极差(rang

6、e,R)(也称组 距),R=max x-min x;R=76.77-20.47=56.30(2)确定组数L组数L与样本容量n有关,一般数据少于 100个时,可以分为7-10组。数据较多时,可 以分为15-20组。可以用以下公式计算:=1+叫;。/叫;。2.2.1 Excel(2)确定组数L也可以参照下表进行。样本容量n组数L30 605871060100100-20091220050010 18500以上15 30本例中n=128,L可以先取10。2.2.1 Excel(3)确定组距Ii=R/L=56.30/10=5.636一般组距不要取小数点多的数。(4)确定组中值第一个组中值等于或小于样本

7、最小值+1/2 组距,本例最小值为20.47,组距为6,第一 个组中值=20+3=23;其余的中值依次加组距 确定。2.2.1 Excel(5)在excel中确定接受区域第一个数=第一个组中值+1/2组距=23+3=26,下面的数依次加组距,接受区域最后一个 值一定大于等于最大值::即文件(B 编辑回 视图&)插入格式9)TMCD 维 6 s谢计 W(W)帮助(H)Adobe PDF(B)29二心嚏z。L攵口电电1。JMP 0 6SQ历作:末体-12|B/工 聿W盘里也,盆第|隼隼上&4 0L22 笈ABCDEFGHIJ1总重J_最大值最小值L极值 组中值 接受区域 频数【备注251.9876

8、.7720.4756.323260 x23362.57293226x32448.80样本容量组数组距353832x38534.01128106414438x44635.80475044x50748.50535650 x56842.30596256x62938.72656862x681052.31717468x741124.02778074x801247.641344311439.671538.281652.081748.181853.981947.782044.492137.722.4.1 Excel(6)调用函数FREQUENCY。第一步,选中“频数”列下方的空白单元 格,作为结果输出区域,

9、输入“二frequency;第二步,用鼠标选中“总重(g)”的128 个观测值(或直接输入数据所在单元格“a2:a129”),再输入”隔开;第三步,再用鼠标选中选中“接受区域”的数据(或直接输入接受区域单元格“h2:h129”),输入。f m qi.i ency =f requency(a2:al 29,h2:hl 1):现文件编本视图包)插入格式工MCD 纯 6SQ统计窗口映)帮助 Adobe PDFB)一 U I 1二等戮 由 3 I 9 工 1 1小二工三 JMP R 6 sos划言体 小2 1上I-.三三上兽,AloABcDEFGHIJ1一总重.最大值最小值极值组中值接受区域频数备注2

10、51.98176.7720.4756.3123f requency(a2:al 29,h2:hll)362.57293226x32448.80样本容量组数组距353832x38|534.01128106414438a444 J635.80475044G50748.50535650 x56842.30596256cx62 1938.72656862x68 11052.31717468x74 1124.02778074x80|121 47.641344.3114R 39.671538.281652.0817r 48.181853.982.4.1 Excel按“Ct rl+Shift+Ent er”

11、,获得结果。文件()制视图M插入0)管I 12 B Z U具健(W 6 SQ计窗口改)帮助CH)Adobe PDF(B)引二J弊Z 黄包幽易100%侬6 SQS史操作5冬至1噂,之望享学1a王虫 a 口宁12A 总重(g)51.98B&仁FREQU C 最大值 76.77ENCY(A2:A D 最小值 20.47129,H2:H1 r e 极值56.31)FG 组巾值 23H 接受区域 26I 频数5J备注 0 x2362.5729321126x3248.8034.0135.8048.50样本容量128组数10组距 635414738445023212932x38 38G44 44x50753

12、562550 x56842.305962856x62938.726568562x681052.317174068x741124.027780174x801247.641344.311439.671538.281652.081748.181853.981947.782044.492.4.1 Excel图图图图散图国一形 柱图 点形线图骨积环达面 条折mXY面圆雷曲图(8)选择柱形图中的第一个图,点击“下一 步”,出现如下对话框:废表向导-4步塞之2-图表源数相|卫J士昼二|I住据区i鼠系列数据区域Q):翔国!眄壅殴52系列产生在:。行。列取消 K上一步 下一步)完成(9)点击系列,切换对话框,点

13、击“分类(X)轴标志(T)”的按钮:(10)出现“分类(X)轴标志”的对话框,选 中“组中值”数据GHIJKLMN0组巾值接受区域;232650 x度表向导 4步察之2图表源数据分类(X)轴标志:.I wS|293211 26二Sh“t l!$G$2:$G$Un;3538 J2332m”442138x44:47502944x5053562550 x565962856x62:6568562x6874068x74801 174x801(11)点击“分类(X)轴标志”对话框,返回对话梅数据区域添加|删除国)|取消上一步也)一步理)二成(E)(12)点击“下一步”废表向导4步要之3-图表选项 I卫上百

14、局R5O坐标轴网格级 图例 数据标志数据表 图表标题):分类00轴:数值Of)轴9:次分类00轴00:次数值。轴:取消 实用工具 注册购买(B)其它(Q)画文件电)编辑(E)视图包)插入 格式(0)工具(D 数据)6SQ统计 窗口 帮助U嚏E,如期电100%06SQ历史操作d:宋体 72 TB/ul室春季卸券,P17 仪ABCDEFGHIJKLMN0PQR1总重(g)251.98362.57448.80534.01635.80748.50842.30938.721052.311124.021247.641344.311439.671538.281652.081748.18111853.9819

15、47.782044.492137.722261.682336.992426.492554.522635.672750.762854.342946.453039.963154.073245.773355.863455.783548.803636.773731.823851.893937.784044.81旧文件 编辑 视图 插入 格式 工具(D 数据)6SQ统计 窗口 帮助!与&心退知攵I幽出100%g 6SQ历史操作同:宋体 vB/n 号号聂昌%,J 3 笈=IF(ROW(1:1)$F$4,”,AVERAGE($H$3:$I$3)ABc IdEFG_ HI,TKl ImN0PQRs 1_T_1

16、 I1总重(g)原始数据参数直方图计苴表 不合格数据1=频数一正态概率1251.98数据置信度(%)95.00%组下限蛆上限蛆中值频数正态概率不合格个数1362.575 1.98小数位数220.46 526,09623.280550.0285 8215176.77302520-0.250.20.15448.806 2.5 7区间个数1026.09631.72728,911580.072773612/-b OJ534.0148.8区间宽度5.6 3131.72737.35 834.5 425220.1387883337-635.8034.0137.35842.98940.1735240.1982

17、8507715105*0.10.05748.5035.8统计量42.98948.6 245.8045240.212235478842.3048.5数据个数12848.6 25 4.25 15 1.435 5220.170193567,/soo938.7242.3平均值44.314921885 4.2515 9.8825 7.0665160.1022456999、-Q-I1052.3138.72标准偏差10.350483425 9.8826 5.5 136 2.697560.0460126561124.025 2.31方差107.13250716 5.5 1371.1446 8.328500.0

18、15508485N 6 sl.06S CM COCO 亡 0bl 1 900(0ID in 9A1247.6424.02偏度0.05770698671.14476.77573.959510.0039140761344.3147.6 4唾度-0.0897884441439.6744.311111111538.2839.6 7最小值20.471652.0838.28第一四分位数36.9351748.185 2.08中位数45.21853.9848.18第三四分位数5 1.96 5111111947.785 3.98最大值76.772044.4947.7812137.7244.49置信区间2261.

19、6837.72平均值2336.996 1.6 8LCI41.2381746 1oooooooooo 1cMe0b LD 9Ao062426.4936.991147.3916 6 9142554.5226.49中位数2635.675 4.5 2LCI42_平均值一中位数|2750.7635.6 7UCI46.712854.345 0.76标准偏差2.521.510.502946.455 4.34119.2190479163039.9646.45UCI11.8009936 53154.0739.963245.775 4.07箱线图3355.8645.77下须线20.473455.785 5.86上

20、须线74.5 13548.805 5.78n CxIOObS 9A co3636.7748.8安德森-达令正塞性检装3731.8236.77AD统计量0.217826 5 113851.8931.82Pffi1.0445 271263937.785 1.89检蛉结果服从正态分布4044.8137.78224 6SQ统计结果:EFG HIJKL参故直方圉计算表置信度(%)95.00%号下限组上限组中值频数正态概率小数位第2_20262350.02899936区间个数10263229110.078656769区间宽度6323835230.153830755384441210.216968888统计

21、里445047290.220721813数据个数128505653250.161952954平均值44.3149218856625980.085 701138标准偏差10.3504834262686550.032700526方差107.132507168747100.008994394隔度0.05770698674807710.001782726嵯度-0.089788444244 6SQ统计结果2:|口 频数 正态概率2.3茎叶图茎叶图(St em and l eaf pl ot)又称“枝叶图”,它的基本思路是将样本中的数据按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将

22、变化大的位的数作为分枝(叶),列在 主干的后面,这样就可以清楚地看到每个主干后面 的几个数,每个数具体是多少。这里仍然以128只 马氏珠母贝总重数据为例制作茎叶图,可以用 Minit ab、SPSS等软件。文件(E)编辑色)数据 计算 统计(S)图形 编辑器)工具 窗口 帮助(H)言m爵1X电0c c|屋I t I找福|0智鼻|心显与1 E里国画i画R I T唱曲褊1袈威I 731、万十 口=I 31 X|Q T=O。上凹-2010-8-29 19:05:12欢迎使用Minit ab,谙按F1获得有关帮助。谶128个贝重.MTW*,-cl-C2-C3-C4C5C6C7C8C9-cToC11C1

23、2C13-C1405-C16C17-C18C19-C20-C21总重(g)15 1.98262.57348.80434.01535.80648.5 0742.30838.7295 2.311024.021147.6 41244.311339.6 71438.28155 2.081648.18175 3.981847.7810)251 Minitab鼠会话茎叶图总重(g)N=128叶单位=1.05 2 012349 2 678925 3 001111122333344447 3 555556667777778889999963 4 0011122222223444(26)4 5555556666

24、666677888888899939 5 000011112222333444420 5 55555567778887 6 122232 6 51 71 7 6结果解读:从结果中可以得到,样本容量 为128,叶的单位是L0,也就是将 观测值通过四舍五入取整了。茎叶图有三列数。左边的一列 是频数;中间一列是茎,这里就是 测量值的十位数;右边的是数组中 的变化位,它是按照大小顺序将测 量值的个位数一一列出来,象一条 枝上抽出的叶子一样,所以人们形 象地叫它茎叶图。251 Minitab鼠会话茎叶图总重(g)N=128叶单位=1.05 2 012349 2 678925 3 001111122333

25、344447 3 555556667777778889999963 4 0011122222223444(26)4 5555556666666677888888899939 5 000011112222333444420 5 55555567778887 6 122232 6 51 71 7 6结果解读:频数第一个是5,茎是2,叶是 01234,表明2024范围内的观测 值有5个,分别是20、21、22、23、24共5个。频数第二个是9,茎是2,叶是 6789,表明2629范围内的观测值 有4个(本行的9减去上一行的5),分别是26、27、28、29共4个。第三个频数是25,茎是3,叶 是00

26、11111223333444,表明3034 范围内的观测值有16个(25-9),分别是30、30、31、31、31、31、31、32、32、33、33、33、33、34、34、34共 16个。251 Minitab鼠会话 结果解读:茎叶图总重(g)N=128叶单位=1.05 2 012349 2 678925 3 001111122333344447 3 555556667777778889999963 4 0011122222223444(26)4 5555556666666677888888899939 5 000011112222333444420 5 55555567778887 6

27、122232 6 51 71 7 6依次类推,直到带括号的 中心的数(26),表示中位数 在此频数在该行,4449范围 内的观测值有26个。从中心数 往下,当前行的观测值个数等 于当前频数减去下一行频数,如倒数第四行,该行观测值数 量有5个(本行的7减去下一行的2),分别是61、62、62、62、63o2.5茎叶图茎叶图是一个与直方图相类似的特殊工具,但 又与直方图不同,茎叶图保留原始资料的资讯,直 方图则失去原始资料的讯息。将茎叶图茎和叶逆时 针方向旋转90度,实际上就是一个直方图,可以从 中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布 逼近。252

28、 SPSS总重(g)总重(g)Stem-and-Leaf PlotFrequencyStem&Leaf5.002.012344.002678916.003.001111122333344422.003.555556667777778889999916.004.001112222222344426.004.55555566666666 77S88S8SS99919.005.000011112222333444413.005.55555567778885.006.122231.006.51.00 Extrem es0=77)Stem wi dth:10.00Each leaf:1case(s)SP

29、SS的茎叶图同样也是左、中、右三列,每列的频数直接 就是该组的频数,如第三行的 16,表示在3034范围内的观 测值共有16个,分别是30、30、31、31、31、31、31、32、32、33、33、33、33、34、34、34o最后一行表示 有一个值异常(=77)。2.2数据描述统计对于样1个样本的观测值,我们可以计算它 的平均数、中位数、众数、最大值、最小 值、极差、方差、标准差、变异系数等,我们称为对数据进行描述统计。221平均数平均数(me an)一般指算术平均数,是观测 值的总和除以样本容量得到,常用 表示。在Exce l中,有专门的函数可以计算平均数:ave rage。在数据列最后

30、的空白单元格($A$130)中输入“ave rage,即会出现以下提示:128 20.47127 23.45130|=I131 I average(132 I AVERAGE(nuMberl,number2,.)2.2.1平均数选中所有数据,输入右括号)”,即会出现 以下:221平均数按回车键后,单元格$A$130即会出现平均 数的计算结果44.31:221平均数样本容量n的计算函数:count(),如计算 例1的样本容量n,可在单元格$A$130输入a=count(A2:a129)J,:12712812913030.9220.4723.45二co unt(I131 A2:A129)2.2.1

31、平均数回车,即可得到结果,n=128:127 30.92128 20.47127 234513CT 128平均数与每一个观测值都有关系,有较高的代表 性,但它也容易受到极端值的影响。222中位数中位数(Me d ian)是把一组观测值按从小到大的 数序排列,在中间的一个数(或两个数的平均值)叫做这组数据的中位数,记作Md。当样本数为奇 数时,中位数=第(11+1)/2个数据;当样本数为偶 数时,中位数为第n/2个数据与第n/2+1个数据的 算术平均值。222中位数在Excel中,有专门的函数可以计算平均数:median()。如计算例1的样本的中位数,可在数据列最后的空白单元格($A$130)中

32、输入“median(,即会出现以下提示:12512612712812913013137.0833.1730.9220.4723.45二 MEDIAN。MEDIAN(number number2,)222中位数选中所有数据,输入右括号)”,即会出现 以下:12537.08|126L 33.1712730.92 H12820.4712923 45130二 MEDIAN(1131A2:A129)1 J132222中位数按回车键后,单元格$A$130即会出现平均 数的计算结果45.20:1253.0812633.1712730.9212820.4712923.4513045.2013111 1222中

33、位数中位数不受分布数列的极大或极小值影响,具有“抗性”,不像算术平均数那样“敏感”。存在极端值的资料不宜用平均数,像收入、住 房等,数据比较分散,如果存在两极分化严重,就不适宜用平均数。如某公司的33名职工的月工 资(以元为单位)如下:本例中,该公司的平均工资数为3500,而中位数工资数为1500。董事长副董事长董事总经理经理管理员人数11215320工资300002500035005000250020001500223众数众数(Mode)是一组数据中出现次数最多的数 值,有时众数在一组数中有好几个。在Excel中,有专门的函数可以计算平均数:mode()o在数据列最后的空白单元格($A$13

34、0)中输入“mode(,即会出现以下提示:12512612712812937.0833J730.9220.4723.45130=mo d巳(MODE(nuaber number 2)223众数选中所有数据,输入右括号)”,即会出现 以下:12512612712812937.0833.1730.9220.4723.45130 二mo d e(1311A2:Al29)132223众数按回车键后,单元格$A$130即会出现平均 数的计算结果48.80:12537.0812633.1712730.9212820.4729|P 23.45130|48.80113111_1223众数众数不受极端值的影响,

35、但它也没有利用全部数据信息,而且还具有不惟一性。如果样本数据的分布没有明显的集中趋势或:高峰点,也可能没有众数;如果有两个最高峰点,那就有两个众数。只有在总体单位比较多,而且又明显地集中于某个变 量值时,计算众数才有意义。223众数例:某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场某季度男 皮鞋的销售情况,得到资料如下表:男皮鞋号码/厘米销售量/双24.01224.58425.011825.554126.032026.510427.052合计1200从表中看出,25.5厘米 的鞋号销售量最多,如果我 们计算算术平均数,则平均 号码为25.65厘米,这是没有 实际意义的,因此利用用

36、 25.5(众数)厘米作为样本 数据集中趋势,既便捷又符 合实际。224几何平均数几何平均数(geometric mean)是指n个 观测值连乘积的n次方根就是几何平均数,记作G。根据资料的条件不同,几何平均数 分为加权和不加权之分。G=y 石尤2%=(%马豆)2.2.4几何平均数例19941998年我国工业品的产量分别是上年的 107.6%、102.5%、100.6%、102.7%、102.2%,计算这5年的平均发展 速度。G=%.076*1.025*1.006*1.027*1.022 x 100%;103.1%224几何平均数在Excel中,有专门的函数可以计算平均数:geomean()o

37、在数据列最后的空白单元格 中输入“geomean(,即会出现以下提示:年份增长1994年107.60%1995车102.50%1996车100.60%1997车102.70%1998车102.20%平均=GE0MEAN(GEOMEAN(nuber 1,number2.)2.2.4几何平均数选中所有数据,输入右括号)”,即会出 现以下:F 年份 1994年 1995车 1996车 1997车 1998 车 平均HIG,增长.107.60%102.50%100.60%102.70%1 102.20%1=GE0MEAN(G2:G6)GEOMEAN(nt uber 1 number2,.)按回车键后,

38、单元格$A$130即会出现平均数的计算结果 1.030935o2.2.4几何平均数例2007年银行公布的定期存款利率分别是:三个月3.33%,半年3.78%,一年4.14%,两年4.68%,三年5.40%,五年5.85,求平均年利率。本题需要加权。G=025+05+1+2+31.033325*l.O37805 X.04141*1.04682*1.0543*1.05855 x 100%=105.27%224几何平均数几何平均数仅适用于具有等比或近似等比 关系的数据。几何平均数受极端值的影响 较算术平均数小。但观测值中任何一个变 量值不能为o,如上例中,银行利率为 3.78%,计算时要写成1.03

39、78,当银行利 率为0时,就不至于计算无意义。2.2.4几何平均数以上算术平均数、中位数、众数、几何平 均数都是描述数据的集中性,及指出数据集中较多的位置。此外还有描述数据离散性的特征数,表示数据之间参差不齐的程 度。这些特征数一般有极差、方差、标准 差、标准误、偏度、峰度与变异系数。225极差极差(range)是最大值与最小值的差,记 作R。在Excel中,可以用函数max()、min()分别计算最大值与最小值,然后相减 求得极差。2.2.6方差与标准差方差(Variance)和标准差(St andarddeviat ion)都是描述观测值围绕平均数的波动程度的特征值,是测度数据变异程度的最

40、重要、常用的指标。方差也称变异数、均方。作为统计量,方差常用 符号S2表示,作为总体参数,常用符号?表示。226方差与标准差标准差是方差的平方根,样本的标准差常用S或 SD表示。若用o表示,则是指总体的标准差。方差它是每个数据与该组数据平均数之差乘方后 的均值。本章只讨论对一组数据的描述,尚未涉 及总体问题,故本章方差的符号用s2,标准差的 符号用s。2_Z(%-S n-12.2.6方差与标准差 Excel中计算方差的函数为var(),计算标准差的函数为stdev()。如例,计算128个马氏珠母贝总重测量值的方差,可以在 Excel中如下计算:12512612712812913013137.0

41、833.1730.9220.4723.45二 VAR(A2:|A129)回车后,结果即是方差值107.13。2.2.6方差与标准差同样,利用函数st dev(),计算出128个马氏珠母 贝总重测量值的标准差为10.35o为了说明一个样本的变异程度,常常在平均数后 面加上标准差,写成土 SO o如128个马氏珠母 贝的测量结果可以记作48.80+10.35 o2.2.6方差与标准差在单位相同、均数相近的情况下,标准差 越大,说明观测值间的变异程度越大,即 观测值围绕均数的分布较离散,均数的代 表性较差。反之,标准差越小,表明观测 值间的变异较小,观测值围绕均数的分布 较密集,均数的代表性较好。在

42、研究中,对于标准差的大小,原则上应该控制在均 值的12%以内,如果标准差过大,将直接影 响研究的准确性。2.2.6方差与标准差在正态分布的情况下,当观测值在x s范围内,观测值数量占样本含量的68.27%;当观测值在x 2s范围内,观测值数量占样本含量的95.45%;当观测值在x3s范 围内,观测值数量占样本含量的99.73%。227标准误在实际工作中,我们无法直接了解研究对 象的总体情况,经常采用随机抽样的方法,取得所需要的指标,即样本指标。样本指 标与总体指标之间存在的差别,称为抽样 误差,其大小通常用均数的标准误(Standard Error)来表示。因此标准误反 映的是不同样本的平均数

43、之间的变异。而 标准差是描述单个样本中观测值的离散程 度及衡量平均数抽样误差大小的尺度,标准误与标准差是不同概念。227标准误标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。标准误一般用L表示,标准误的大小与标准差成正比,而与样本含量n的平分根成反比,标准误的 计算公式为:sL-/7n2.2.8变异系数变异系数(Coefficient of Variance)是衡 量资料中各观测值变异程度的另一个统计 量。当进行两个或多个资料变异程度的比 较时,如果度量单位与平均数都相同,可

44、 以直接利用标准差来比较。如果单位或平 均数不同时,比较其变异程度就不能采用 标准差,而需采用变异系数来比较。变异 系数记作C.H,其计算公式为:VCV.=-xl OO%2.2.8变异系数例,2003年4月在海南陵水黎安港同时繁 殖了马氏珠母贝三亚与流沙两个品种,养殖 在陵水黎安港,2005年3月分别对两个品种 随机取样,测量结果分别为6.680.86、6.270.25,单位cm,比较两个品种的变 异程度就可以通过计算CI Z,分别为 12.86%与10.32%,表明流沙品种的壳高变 异程度要比三亚品种的变异程度小,即流沙 品种长得更整齐。2.2.9偏度与峰度偏度(Skewness)是描述某变

45、量取值分布对称性的统计 量。在Excel中,偏度前以用skew)计算。Skewness=09分布形态与正态分布偏度相同;Skewness。,长尾巴拖在右边;SkewnessvO,长尾巴拖在左边。峰度(Kurto sis)是描述某变量所有取值分布形态陡缓程 度的统计量。在Excel中,峰度可以用kurt()计算。峰度也是和正态分布相比较的。Kurto sis=09与正态分布的陡缓程度相同;Kurto sis0,比正态分布的高峰更加陡峭英顶峰;Kurto sis XAl-A宋体 12 描述统计105106107108109110111112113114117H89 o 1 2 31 2 2 2 2

46、2627128129130点40.7039.9353.1422.7021.4435.4441.4432.8348.0542.4742.1239.3833.4431.1529.8730.2231.8537.2745.9734.8037.0833.1730.9220.4723.45:$A$129|L_J,块拉到最 出现,按*示点击数!Shee t 1/Sheet 2/Shee t 3/-*v I数字2.3.1 Excel点击对话框右侧的同:0 xO Micro so ft Excel-d ata2.3.1 Excel返回上级对话框,前面的口内打4,在“标志位于第一行”然后选择“输出区域”:描述统计

47、输入输入区域a):分蛆方式:$A$17$A$129 国|确定回标志位于第一行输出选项 输出区域):O新工作表组化):O新工作薄世)0汇总统计6)国平均数置信度国):回第K大值Q):回第K小值也):逐列 O逐行0帮助国)%952.3.1 Excel这里选择c列第一行作为输出起始区域($C$1):2.3.1 Excel返回上级对话框,点击“确定”下结果:,得到如ABCD1总重总重(g)251.98362.57平均44.31492448.80标准误差0.914862534.01中位数45.2635.80众数48.8748.50标准差10.35048842.30方差107.1325938.72峰度-0

48、.089791052.31偏度0.0577071124.02区域56.31247.64最小值20.471344.31最大值76.771439.67求和5672.311538.28观测数1281652.08最大76.771748.18最小20.471853.98置信度(95.0%)1.81034771947.78整个过程的操作:逾文件(E)编辑 视图)插入 格式 工具(工)数据)窗口包)帮助但)2七。金必修山学总1丛亳上“”可0,1晟,到川幽100%3 宋体 12 B/u室专基强理,中与享享V25ABCDEFGHIJKLMN0PQR1总重(g)251.98362.57448.80534.0163

49、5.80748.50842.30938.721052.311124.021247.641344.311439.671538.281652.081748.181853.981947.782044.492137.722261.682336.992426.492554.522635.672750.762854.342946.453039.963154.073245.773355.863455.783548.803636.773731.823851.893937.784044.812.3.1 Excel以上就是128个马氏珠母贝总重的描述统计。平均值为44.31492,标准误差是0.914862,中位

50、数是452,众数是488标准差是 10.35 048,方差是 107.1325,等等。232 Minitab Mirdt ab统计软件为质量改善和概率应用提 供准确和易用的工具,是统计学入门教育 方面技术领先的软件包。Mirdt ab在国内由 上海泰珂玛信息技术有限公司 _(ht t p:/www.minit )代理。目前 Mirdt ab16提供30天的免费试用期。p2 Mi ni tab-无标题232 Minitab还是以128个马氏珠母贝的总重观测值为例,用Mirdt ab进行描述性统计分析。(1)输入数据,可以直接从Excel中复制 后粘贴到工作表中。显示命令历史记录文件夹,Cl C2

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 应用文书 > 统计图表

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服