资源描述
绪绪论论统计学概述医学知识专题讲座1/30一一.什么是统计学什么是统计学(Statistics)Thedisciplineconcernedwiththetreatmentof numerical data derived from groups ofindividuals(P.Armitage).关于处理数据学科。关于处理数据学科。Thescienceandartofdealingwithvariationin data through collection,classification andanalysis in such a way as to obtain reliableresults(JMLast).经经过过搜搜集集、分分类类和和分分析析,处处理理数数据据变变异异性性科科学学与艺术,意在取得可靠结果。与艺术,意在取得可靠结果。统计学概述医学知识专题讲座2/30卫生统计学(卫生统计学(MedicalStatistics)数理统计学在医药卫生领域中应用。数理统计学在医药卫生领域中应用。为何学习医学统计学为何学习医学统计学?(1)医学研究需要;医学研究需要;(2)更新医学知识需要;更新医学知识需要;(3)处理本身工作和研究数据。处理本身工作和研究数据。统计学概述医学知识专题讲座3/30二二.基本概念基本概念同质同质:同类个体含有共性。同类个体含有共性。变异变异:同类个体间差异,如身高、体重同类个体间差异,如身高、体重1.同质与变异同质与变异统计学概述医学知识专题讲座4/30总体(总体(population):打算研究全部个体打算研究全部个体大同小异大同小异样本(样本(sample):总体中,含有代表性一部分。总体中,含有代表性一部分。随随机机化化(randomization):使使样样本本含含有有代代表表性性主要方法。主要方法。2.总体与样本总体与样本统计学概述医学知识专题讲座5/30统计学概述医学知识专题讲座6/30随机(随机(Random)随随机机事事件件:在在一一次次试试验验中中可可能能发发生生,也也可可能能不不发生事件。发生事件。在试验之前,无人知道发生还是不发生。在试验之前,无人知道发生还是不发生。经大量试验,这类事件是有一定规律。经大量试验,这类事件是有一定规律。统计学概述医学知识专题讲座7/303.概率与频率概率与频率度量随机事件发生可能性大小。度量随机事件发生可能性大小。A:随机事件;随机事件;P(A):随机事件:随机事件A发生概率;发生概率;P(A)=1,事件事件A一定发生;一定发生;P(A)=0,事件事件A绝对不发生。绝对不发生。统计学概述医学知识专题讲座8/30假如:假如:观察次数观察次数:n(足够大);(足够大);事件事件A发生数发生数:m;那么:事件那么:事件A发生概率发生概率P(A)m/n(频率或相对频率)(频率或相对频率)概率预计概率预计频率频率统计学概述医学知识专题讲座9/30必定事件必定事件P=1随机事件随机事件0P 1不可能事件不可能事件P=0 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为)称为小概率小概率事件事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生。小概率事件小概率事件CertainCertainImpossibleImpossible0.501统计学概述医学知识专题讲座10/30频率与概率间关系频率与概率间关系1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动2.样本含量样本含量n越大,波动幅度越小,频率越大,波动幅度越小,频率越靠近概率。越靠近概率。统计学概述医学知识专题讲座11/304.参数与统计量参数与统计量参数参数:定量反应总体某个性质;定量反应总体某个性质;通惯用希腊字母表示,如通惯用希腊字母表示,如,经常未知经常未知统计量统计量:定量反应样本某个性质;定量反应样本某个性质;通惯用拉丁字母表示,如通惯用拉丁字母表示,如s,p统计学概述医学知识专题讲座12/305.误差(误差(Error)测量值测量值=真值真值+随机误差随机误差+非随机误差非随机误差 Xi=i +i1随机误差(随机抽样误差):随机误差(随机抽样误差):影响原因众多,改变无方向性,不可防止,但可用统影响原因众多,改变无方向性,不可防止,但可用统计方法进行分析。计方法进行分析。2系统误差系统误差受确定原因影响,大小改变有方向性。受确定原因影响,大小改变有方向性。3非系统误差(过失误差)非系统误差(过失误差)研究者偶然失误而造成误差。研究者偶然失误而造成误差。偏差偏差(bias)(bias)统计学概述医学知识专题讲座13/306.准确度与可靠度准确度与可靠度准确度准确度(accuracy)或真实性(或真实性(validity):观察值:观察值与真值靠近程度,受系统误差影响与真值靠近程度,受系统误差影响(惯用指标:如惯用指标:如灵敏度、特异度灵敏度、特异度)。可靠度(可靠度(reliabiliy)也称精密度也称精密度(precision)或或重复性(重复性(repeatability):重复观察时重复观察时观察值与其观察值与其均值靠近程度,受随机误差影响(惯用指标:一均值靠近程度,受随机误差影响(惯用指标:一致百分率、致百分率、Kappa值)。值)。统计学概述医学知识专题讲座14/30统计学概述医学知识专题讲座15/30三、统计工作基本步骤三、统计工作基本步骤1.研究设计研究设计2.搜集数据搜集数据3.整理数据整理数据4.数据分析数据分析统计学概述医学知识专题讲座16/30四、学习目标与方法四、学习目标与方法(1)统计思维享用一生)统计思维享用一生事件不确定性事件不确定性概率概率由样本推断总体,结论不确定性由样本推断总体,结论不确定性有有可能犯错误可能犯错误统计学任务统计学任务限定犯错误概率大小,在限定犯错误概率大小,在以前提下,作决议以前提下,作决议统计学概述医学知识专题讲座17/30(2)了解概念是首位)了解概念是首位如:研究设计标准如:研究设计标准确定样本量依据确定样本量依据参数预计精度参数预计精度决议两类错误决议两类错误统计学概述医学知识专题讲座18/30(3)重在了解和解释结果)重在了解和解释结果经过计算,体验统计概念和思想经过计算,体验统计概念和思想正确了解、解释和表示计算结果正确了解、解释和表示计算结果统计学概述医学知识专题讲座19/305.数据类型数据类型统计学概述医学知识专题讲座20/30住院号住院号年纪身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552716571.55无无中学中学顺产顺产足月足月20256532216074.05无无小学小学助产助产足月足月20258302515868.06管理员管理员大学大学顺产顺产足月足月20225432316169.05无无中学中学剖宫产剖宫产足月足月20224662515962.011商业商业中学中学剖宫产剖宫产足月足月20245352715768.02无无小学小学顺产顺产早产早产20258342015866.04无无中学中学助产助产早产早产4642415870.53无无中学中学助产助产足月足月20257832915457.07干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量变量variablesQuantitativedata计量资料计量资料Qualitativedata计数资料计数资料Units;elements统计学概述医学知识专题讲座21/30(1)计量资料)计量资料用仪器、工具等用仪器、工具等测量测量(measure)方法取得方法取得数据,即为数据,即为计量资料计量资料(Measurementdata),),也叫定量数据(也叫定量数据(Quantitativedata)。)。特点:特点:有计量单位有计量单位,如患者身高(,如患者身高(cm)、)、体重(体重(kg)、血压()、血压(mmHg)、脉搏(次)、脉搏(次/分)分)、红细胞计数(、红细胞计数(10/L)。)。统计学概述医学知识专题讲座22/30(2)计数资料计数资料按某种属性分类,然后清点每类数据,按某种属性分类,然后清点每类数据,称称计数资料计数资料(Countdata)或)或(Enumerationdata),也叫定性数据),也叫定性数据(Qualitativedata)。)。特点:特点:无固有计量单位无固有计量单位,如肤色(黑、白),如肤色(黑、白)、血型(、血型(ABO)、职业(工农兵)、性别)、职业(工农兵)、性别(男女)。(男女)。统计学概述医学知识专题讲座23/30(3)等级资料等级资料Rankdata半定性或半定量观察结果。有大小次序,半定性或半定量观察结果。有大小次序,所以也叫所以也叫有序分类资料有序分类资料(Ordinalcategorydata)。)。癌症分期:早、中、晚;癌症分期:早、中、晚;药品疗效:治愈、好转、无效、死药品疗效:治愈、好转、无效、死亡;亡;尿蛋白:尿蛋白:,+,+及以上及以上统计学概述医学知识专题讲座24/30实例数据实例数据1统计学概述医学知识专题讲座25/30实例数据实例数据2统计学概述医学知识专题讲座26/304.变量类型转化变量类型转化只能由高级向低级转化只能由高级向低级转化,不能作相反方向转化不能作相反方向转化连续型连续型有序有序分类分类二值二值离散型变量经常经过适当变换或连续性校正离散型变量经常经过适当变换或连续性校正后借用后借用连续型变量或有序变量连续型变量或有序变量方法来分析。方法来分析。统计学概述医学知识专题讲座27/30 例:一组例:一组20 40岁成年人血压岁成年人血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料统计学概述医学知识专题讲座28/30本章重点内容本章重点内容1.统计学惯用基本概念统计学惯用基本概念2.数据分类数据分类统计学概述医学知识专题讲座29/30谢谢谢谢统计学概述医学知识专题讲座30/30
展开阅读全文