收藏 分销(赏)

三统计资料的呈现统计图表.ppt

上传人:天**** 文档编号:1849298 上传时间:2024-05-10 格式:PPT 页数:95 大小:2.59MB
下载 相关 举报
三统计资料的呈现统计图表.ppt_第1页
第1页 / 共95页
三统计资料的呈现统计图表.ppt_第2页
第2页 / 共95页
三统计资料的呈现统计图表.ppt_第3页
第3页 / 共95页
三统计资料的呈现统计图表.ppt_第4页
第4页 / 共95页
三统计资料的呈现统计图表.ppt_第5页
第5页 / 共95页
点击查看更多>>
资源描述

1、第三章第三章 敘述統計(II):統計量法學學 習習 目目 標標1.介紹常用的統計量數來表達資料的特性。2.學習集中趨勢的統計量數。3.學習位置的統計量數。4.學習分散程度的統計量數。5.學習如何建立全方位的統計圖盒鬚圖。6.學習形狀的統計量數有偏度與峰度。7.學習如何計算分組資料。8.認識謝比雪夫不等式與經驗法則。9.學習Z分數的應用。10.洞悉平均數、變異數及標準差的重要性質。本本 章章 架架 構構n3.1 集中趨勢統計量數n3.2 位置統計量數n3.3 分散程度統計量數n3.4 全方位的統計圖盒鬚圖n3.5 形狀統計量數n3.6 分組資料的統計量數n3.7 謝比雪夫不等式與經驗法則n3.8

2、 z分數的應用n3.9 樣本平均數、樣本變異數及樣本標準差的重要性質3.1 集中趨勢統計量數集中趨勢統計量數(又稱位置統計量數又稱位置統計量數)n3.1.1 平均數(mean)n3.1.2 中位數(median)n3.1.3 眾數(mode)n3.1.4 百分位數(percentile)3.1 集中趨勢統計量數集中趨勢統計量數(續續)n所謂集中趨勢統計量數是以一個數值來描述樣本資料中,那一個分數或數值是最具代表性,或集中在那個中心位置故又稱位置統計量數。n最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean),到底用那一個集中量數和資料衡量尺度以及研究之目

3、的有關。3.1.1 平均數平均數n平均數(mean)為所有數值總和除以所有數值的個數(即算數平均),當資料是屬量資料時適用。母體平均數():樣本平均數():註:唯一值;:非唯一值 xi=N ;xi=n 例例3.1:平均數平均數n若全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤,試求其母體平均數?若以上資料為抽自全班60位同學的樣本觀察值,則其樣本平均數為何?解:例例:平均數平均數n已知樣本資料2,3,5,10,15,若其中有所誤植,15應為85才正確,問平均數有何變化?解:解:根據誤植的資料,則樣本平均數為(2+3+5+10+15)/15=

4、7;若將15改為85,則樣本平均值變為21,為原值的三倍。n由上例可以知道平均數對於極端值(如上例中之85)的敏感度很強,這是採用平均數作為集中趨勢統計量數應特別留意之處。為此,我們介紹中位數來克服這樣的疑慮。平均數易於數學計算之特性平均數易於數學計算之特性 例如兩組樣本資料的個數與平均數分別為n1和n2及和 ,則將兩組資料合併後的樣本平均數為 註:平均數具有如此的功能,但中位數和眾數則無法同理得知,也就是說,兩組資料合併後的中位數和眾數都無法以一關係式來直接代表。例例:平均數平均數例:設有A,B,C三班學生人數分別為N1=50,N2=48,N3=52,今在某次統計學期中考平均成績分別為1=8

5、0,2=76,3=85,試求出此三班統計學期中考總平均成績 解:=80.45修正平均數修正平均數n調查大學生每周上網時數,今隨機抽取n16學生其資料如下:4,5,6,8,9,10,12,14,15,15,15,16,17,18,20,26(1)求平均數(2)求5修正平均數Sol:(1)=13.125 (2)修正平均數 =12.86註:求修正平均數前需先將原資料排序離差離差n離差:如 資料Xi在 右邊 如 資料Xi在 左邊n離差和:平均數性質平均數性質nXi=n ;Xi=Nn(Xi -)離差值 (Xi -)=0nmin (Xi -A)2 A=n易受離群值(outlier)影響,可用修正平均數改善

6、。(極端值(extreme value)n變數變換:Y=a X+b =a +bn平均數有算術平均數、幾何平均數及調和平均數,其中以算術平均數最簡易且適合代數運算,故往後探討平均數以算術平均數為主。3.1.2 中位數中位數n中位數(median)將資料由小到大(或由大到小)順序排列後,位於中心的數值稱之,通常以Me表示,當資料是屬量資料時適用。n計算方法 將資料由小到大排序寫成x(1),x(2),x(n)續例續例3.1n求12位學生的體重之中位數?解:全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤。將12位學生的體重由小到大排序如下:35,3

7、8,39,40,42,43,46,48,50,51,54,54,因為n=12為偶數,故中位數為排序第六和第七位數值的平均,即註:Min|xi-A|A=Me(中位數)3.1.3 眾數眾數n眾數(mode):指資料中出現次數最多的數或分組名稱則稱此為眾數以Mo表示。當數據或名稱各只出現一次時,眾數便不存在,但因次數可能相同,故眾數可能不唯一。屬質資料的集中趨勢統計量數,用眾數表示最為適當。註:眾數與中位數一樣,僅考慮其中幾個數值,故不 適合代數運算,但平均則否。例例3.5 眾數眾數例:擲一公正的骰子10次,其點數分別為3、6、2、6、1、4、6、5、3、5,求其眾數?解:點數的出現次數分別為點數1

8、:1次、點數2:1次、點數3:2次、點數4:1次、點數5:2次、點數6:3次,故眾數M0=6。例:血型資料:A型(21),B型(5),O型(12),AB型(2),其它血型(1)M0=A型例例例:某科技大學管理學院院長欲瞭解所屬各碩士班的報名情形,得知資料如下:財金系250人,企管系308人,資管系169人,保險系145人,會計系178人,休閒系134人,問那一碩士班最為熱門?解:各碩士班乃屬質資料,故以眾數代表最為合適,即表示眾數為企管系,報名人數最多,是為某一年度最熱門的碩士班。集中趨勢統計量數的比較集中趨勢統計量數的比較1.當資料是對稱分配時,則平均數、中位數及眾數三者皆相等。2.當數據是

9、屬量資料時,則適用平均數或中位數。3.若為屬質資料時,則應以眾數為最佳選擇。4.以極端值而言,平均數受其影響最為明顯,相較之下,中位數與眾數則對極端值不敏感。5.平均數易於作數學運算,但中位數與眾數則不易達成某些簡單的數學運算目的。平均數、中位數及眾數三者之關係n單峰右偏:Mo Me n單峰左偏:Me 3 Xi為偏離值 (當資料呈鐘形分布)(ii)受偏離值影響:平均值,變異數(標準差),R,MAD,CV 不受偏離值影響:Me,Mo,Pk,IQR例例:基金報酬率是否有偏離值?基金報酬率是否有偏離值?n假設某一年有12檔基金的報酬率(%)如下:15、12、35、14、16、14、17、20、18、

10、17、15、14請繪製盒鬚圖,並判斷是否有偏離值?解:首先,我們計算出x(1)=12,Q1=14,Me=15.5,Q3=17.5,x(12)=35。IQR=Q3 Q1=3.5 1.5 IQR=5.25 當 x Q3+1.5 IQR=22.75 判斷x為偏離值 x(12)=35 為偏離值 然後根據這五個統計量數繪製如圖3.1之盒鬚圖。(此圖係以SPSS統計軟體繪製,Excel軟體無此功能。)例例:基金報酬率是否有偏離值?基金報酬率是否有偏離值?(續續)由圖可知,存在一個偏離值,即報酬率35%的那一檔基金。圖3.1 檔基金報酬率之盒鬚圖RETURN40302010123.4 形狀統計量數形狀統計量

11、數n3.4.1 偏度(skewness)n3.4.2 峰度(kurtosis)n3.4.3 動差(moment)形狀統計量數形狀統計量數(續續)n形狀統計量數(measure of shape)是用以表示資料是否對稱於中心點及寬闊或高聳的程度,主要的統計量數有偏度和峰度兩種。3.4.1 偏度偏度n偏度(skewness)用來說明一組資料是否對稱於中心位置,通常以1表示。n樣本偏度:(1)1 0,單峰右偏 (2)1 0眾數 中位數 平均數圖左偏資料3.4.1 偏度(續3)1 0,高狹峰 (2)2 1圖1謝比雪夫不等式之圖示3.6.1 謝比雪夫不等式(續)謝比雪夫不等式(續)續例續例2.1 您的統

12、計成績如何?您的統計成績如何?n某校抽樣50位同學的統計學期中考成績,將資料以十位數為枝、個位數為葉繪製有序枝葉圖,如圖3.10所示。圖3.10 統計學期中考成績的有序枝葉圖續例續例2.1 謝比雪夫不等式謝比雪夫不等式n就例2.1之五十筆樣本資料(上頁,試問有多少比例的觀察值落於樣本平均數左右兩個樣本標準差的區間內?解:根據謝比雪夫不等式的結論,則至少有75%的資料落於該區間內。本例中,我們可以實際瞭解真正的情形。首先計算 ,所以 s=15.38 因為 k=2,故 ,實際計數後得知有 的資料落於該區間內。3.6.2 經驗法則經驗法則n經驗法則(empirical rule):當資料呈現對稱分配

13、或鐘形分配時,則1.約有68%的資料落在平均數左右一個標準差的區間內。2.約有95%的資料落在平均數左右二個標準差的區間內。3.約有99.7%的資料落在平均數左右三個標準差的區間內。n數學式:P(|X|k)68%,k=1 95%,k=2 99.7%,k=3 3.6.2 經驗法則經驗法則(續續3)圖 鐘形分布曲線下之面積經驗法則的應用經驗法則的應用n根據經驗法則吾人可預測共同基金的報酬率分布情況:平均報酬率加上兩個標準差大約是最佳狀況時的報酬率;平均報酬率剪去兩個標準差大約是最差狀況時的報酬率。換言之,四個標準差大約是最好與最壞時的差距。續例續例2.1 經驗法則經驗法則n例2.1資料呈鐘形分配試

14、,依驗證相關的結論。解:1.在 的區間有33個數據,占33/50=66%。2.在 的區間有49個數據,占49/50=98%。3.在 的區間有50個數據,占50/50=100%。以上三個比例和經驗法則的結論都非常接近,因為資料具有近似對稱分配的性質。謝比雪夫不等式與經驗法則謝比雪夫不等式與經驗法則例:自某大學四年級N=1080學生,測驗智力測驗,得其IQ分數(X)之平均數()=120,標準差()=8。假設資料呈鐘形分布時,試回答下列問題。(1)試利用謝比雪夫定理求出分數108 132區間至少有多少人?(2)試利用經驗法則求區間a,b內約有1026個學生?(3)設依此成績學校給予IQ分數前27名學

15、生獎金做為鼓勵,試問最低分數為多少?3.7 Z分數的應用分數的應用(平均數與標準差之應用平均數與標準差之應用)nz分數(z-score)代表任一觀測值(x)與平均數間的距離有幾個標準差的意義。母體的z分數樣本的z分數註:(i)z分數沒有單位 (ii)若資料Xi呈鐘形分布時則轉為Z分數亦為鐘形分布 (iii)若資料Xi呈鐘形分布時,可以Z分數比較資料排序 (iv)z分數通常被稱為標準化值(standardized value)(v)zi=2 表xi在右邊2倍處 zj=-1.5 表xj在左邊1.5倍處 Z分數的性質分數的性質定理:Z=(X-)/Sx or(X-x)/x (1)zi=0 (2)z=0

16、,=0 (zi -)=0 or(zi -x)=0 (3)變異數:Sz2=1,z2 =1 (4)母體:Zi2=N 樣本:Zi2=n 1註:(i)若資料呈鐘形分布經轉換成Z分數時,當|Zi|3,則Xi為離群值。(ii)若資料為任意分佈時,當Xi Q3+1.5IQR,則Xi為離群值。Z分數的性質分數的性質n註:(iii)資料呈鐘形分布 P(|Z|k)=0.68,k=1 =0.95,k=2 =0.99,k=3 (iv)資料為任意分佈時 P(|Z|k)1-1/k2,k 1 (v)資料呈鐘形分布 當Zi=-1,則Xi=P16 當Zi=1,則Xi=P84Z分數的應用分數的應用n隨機抽出n5個樣本並轉換成Z分

17、數,其分別為 Z1=1.4,Z2=-0.8,Z3=-1.2,Z4=1.6 (1)試問Z5 之值為何?(2)若 =30,S=3,試問x5 之值為何?(3)求 Zi2 之值 解:(1)Zi=0 Z5=-1 (2)Z5=(X5-)/s X5=27 (3)因為此為樣本資料 Zi2=4 例例:統計學成績進步抑或退步?統計學成績進步抑或退步?n小明在班上的統計學期中考成績65分,全班的平均是62分,標準差5分;另其期末考成績為76分,班上的平均是80分,標準差3分,試問小明的成績在班上名次是進步或退步呢?另外,小明期中考成績以相同班上名次則期末考須考幾分?(假設期中考、期末考成績均呈鐘形分布)解:(1)若以數學的基本觀念而言,76分絕對高於62分,但若換算兩次考試的z分數,期中考的z分數為0.6,正數表示高於全班平均;至於期末考則為-1.33,表示在全班平均以下,所以小明的成績就全班而言是退步了。(2)利用期中考、期末考成績的z分數相等。THANK YOUSUCCESS2024/5/8 周三95可编辑

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服