收藏 分销(赏)

第一章医学统计的基本概念.ppt

上传人:精*** 文档编号:1730275 上传时间:2024-05-08 格式:PPT 页数:41 大小:581.51KB
下载 相关 举报
第一章医学统计的基本概念.ppt_第1页
第1页 / 共41页
第一章医学统计的基本概念.ppt_第2页
第2页 / 共41页
第一章医学统计的基本概念.ppt_第3页
第3页 / 共41页
第一章医学统计的基本概念.ppt_第4页
第4页 / 共41页
第一章医学统计的基本概念.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、n什么是统计?n什么是统计学?课堂设问课堂设问统计的含义n古代:数字总计n现代:统计资料 统计工作 统计科学(统计学)统计学:statisticsn统计学的英文词统计学的英文词 statistics 源出于拉丁文,源出于拉丁文,是由是由 status(状态、国家)和(状态、国家)和statista(政(政治家)衍化而来的治家)衍化而来的,可见起源很早并和国家事可见起源很早并和国家事务的管理需求有关务的管理需求有关n科技的迅速发展,科技信息的大量产生。数数据据作为信息的主要载体广泛存在。作为信息的主要载体广泛存在。n面对纷乱复杂的数据世界我们该如何去认识?借助统计学这个工具去发现规律。n统计学就

2、是研究数据及其存在规律的科学。统计学就是研究数据及其存在规律的科学。nStatistics:“a science dealing with the collection,analysis,interpretation and presentation of masses of numerical data”n -Webster 国际大辞典国际大辞典n统计学统计学是是收集收集、分析分析、解释解释与与表达表达数据资数据资料的一门科学。料的一门科学。n医学统计学医学统计学用统计学原理和方法研究用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断生物医学资料的搜集、整理、分析和推断的一门学科。的

3、一门学科。n医学生为什么要学统计?课堂设问课堂设问医学科研工作中常见的统计学问题医学科研工作中常见的统计学问题n治疗2例病人结果都有效,能否说有效率100%?(样本含量的问题)n用乌贝散治疗胃溃疡出血100例,94人有效,是否可认为该药有效率就是94%?(置信区间)n如何判断某新药是否比传统药物效果更好?(假设检验)n子女身高与父母身高有无联系?其关联强度有多大?(相关与回归)n医学科研中如何进行统计工作?课堂设问课堂设问统计工作的基本步骤设计收集资料整理资料分析资料n第一步第一步 设计设计:制定计划,对整个过程进行安排。n 调查设计调查设计 实验设计实验设计 专业设计:选题(提出问题或假设)

4、,专业设计:选题(提出问题或假设),确定研究对象(处确定研究对象(处 理因素),理因素),研究观察指标(评价指标),研究观察指标(评价指标),确定诊断标准(疗效标准),确定诊断标准(疗效标准),确定技术路线(研究方法)确定技术路线(研究方法)统计设计:确定对照形式统计设计:确定对照形式 研究样本含量,研究样本含量,随机抽样或分组方法,随机抽样或分组方法,盲法,盲法,误差来源与控制误差来源与控制 统计分析方法,统计分析方法,统计工作的基本步骤统计工作的基本步骤n第二步第二步 收集资料:收集资料:根据计划取得可靠、完整的资料。收集资料的来源有三种:统计报表:统计报表:日常性工作记录:日常性工作记录

5、:医院病例 专题调查(实验)专题调查(实验):n注重资料的准确、完整、及时。n方式:直接观察、采访、填表和通信等统计工作的基本步骤统计工作的基本步骤n第三步整理资料:原始资料的清理、核实、查对、整理,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:EPIDATA、SPSS、SAS)。分组整理:按质量分组 按数量分组n第四步分析资料(统计分析):运用统计学的基本原理和方法,分析计算有关的指标和数据,阐明事物的规律性。包括:包括:统计描述统计描述 参数估计参数估计 统计推断统计推断 假设检验假设检验二、医学统计学中的几个基本概念二、医学统计学中的几个基本概念n1 1、同质和变异、同质和

6、变异n同质(同质(homogeneity)homogeneity):性质相同:性质相同 除了实验因素外,影响被研究指标的非实验因素除了实验因素外,影响被研究指标的非实验因素(背景条件背景条件)相同。相同。举例举例:同质是相对的:不同研究中或同一研究中不同观察指标对观察对象的同质性要求不同。1、同质和变异n变异(variation):同质基础上被观察对象个体之间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。统计学的目的是揭示同质的总体间的变异,揭示不同总体间的异质性n2 2、总体、总体(population)(populati

7、on)与样本与样本(sample)(sample)n总体总体是是同质的个体所构成的全体。同质的个体所构成的全体。n研究总体研究总体是根据研究目的确定的、同质的全部研究对象。是根据研究目的确定的、同质的全部研究对象。n更确切地说,总体是性质相同的全部观察单位某种变量值更确切地说,总体是性质相同的全部观察单位某种变量值的集合。的集合。n总体可分为有限总体(finite population)和无限总体(infinite population)n样本样本是从总体中按一定程序是从总体中按一定程序(随机随机)抽出的部分观察单位)抽出的部分观察单位组成的集合。(组成的集合。(随机随机样本)样本)n为了了解

8、某地为了了解某地20292029岁健康女性血红蛋白的正常值岁健康女性血红蛋白的正常值范围,现随机调查了该地范围,现随机调查了该地20002000名名20292029岁的健康女岁的健康女性,并对其血红蛋白进行测量,请问本次研究的性,并对其血红蛋白进行测量,请问本次研究的总体是(总体是()A A该地所有该地所有20292029的健康女性的健康女性 B B该地所有该地所有20292029的健康女性的血红蛋白测量值的健康女性的血红蛋白测量值 C C抽取的这抽取的这20002000名名20292029岁女性岁女性 D D抽取的这抽取的这20002000名名20292029岁女性的血红蛋白测量岁女性的血红

9、蛋白测量值值3、抽样 samplingn一个样本要能较好地反映总体,应具有 代表性:保证来自同一总体 随机性:总体中每个个体有相同概率被抽到随机抽样方法:单纯随机抽样、系统抽样(机械抽样)、分层抽样、整群抽样 可靠性:样本含量要足够多n两个或多个样本间比较应具有 可比性:对比各组在各种影响因素的构成应相同、几种实验设计(统计方法选择的一个参考)n完全随机设计(成组设计)将受试对象随机分配到两个或多个处理组中,或分别从不同总体中随机抽样研究n配对设计 将受试对象按一定条件配成对,随机分到两个不同处理组中。可增加各处理组的齐同对比性。n随机区组设计(配伍组设计)配对设计的扩展完全随机设计(一)完全

10、随机设计(一)1.将同质受试对象随机地分配到各处理组,将同质受试对象随机地分配到各处理组,再观察其效应。再观察其效应。2.是单因素两水平或多水平的实验设计方法。是单因素两水平或多水平的实验设计方法。3.纳入标准纳入标准 随机化随机化 排除标准排除标准 研究总体研究总体受试对象受试对象实验组实验组对照组对照组配对设计(一)配对设计(一)1.将受试对象按一定条件配成对子,再将每对中的两将受试对象按一定条件配成对子,再将每对中的两受试对象随机分配到不同处理组。受试对象随机分配到不同处理组。2.配对因素为可能影响实验结果的主要混杂因素。配对因素为可能影响实验结果的主要混杂因素。动物实验:窝别、性别、体

11、重等动物实验:窝别、性别、体重等 临床试验:病情轻重、性别、年龄、职业等临床试验:病情轻重、性别、年龄、职业等3.狭义配对狭义配对:将两个条件相同或相近的受试对象配:将两个条件相同或相近的受试对象配 成对子。成对子。广义配对广义配对:同一受试对象分别接受两种不同的同一受试对象分别接受两种不同的 处理;处理;标本检测、身体的对照部位标本检测、身体的对照部位 实验前后配对实验前后配对配对设计(二)配对设计(二)4.优点优点:与完全随机设计相比,能提高组与完全随机设计相比,能提高组 间均衡性和检验功效;间均衡性和检验功效;样本含量较小样本含量较小5.缺点缺点:配对失败或配对欠佳时,反而会降:配对失败

12、或配对欠佳时,反而会降 低效率。低效率。随机区组设计随机区组设计1.将受试对象按性质相同或相近者(主要影将受试对象按性质相同或相近者(主要影 响因素)组成响因素)组成b b个区组,每个区组中将个区组,每个区组中将k k个个受试对象随机分配到受试对象随机分配到k k个处理组中去,其区个处理组中去,其区组因素可以是第二处理因素,也可以是一组因素可以是第二处理因素,也可以是一种非处理因素。种非处理因素。2.优点优点:组间均衡性较好,减少了误差,提:组间均衡性较好,减少了误差,提 高了实验效率;高了实验效率;3.缺缺点点:要要求求区区间间内内受受试试对对象象与与处处理理数数相相等等,实实验验结结果果中

13、中若若有有数数据据缺缺失失,统统计计分分析析较较麻麻烦。烦。按配伍条件g个水平.实验单位区组1区组2区组3区组n随机分组随机分组g个水平随机分组g个水平随机分组g个水平、参数和统计量n参数(参数(parameter):描述总体的统计指标):描述总体的统计指标 一般用希腊字母表示(一般用希腊字母表示(、)n统计量(统计量(statistic):描述样本的统计指标):描述样本的统计指标 一般用拉丁字母表示(一般用拉丁字母表示(、s、p)、误差(error)误差:误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系系统误差和随机误差(随机测量误差统误差和随机误差(随

14、机测量误差,抽样误差)。抽样误差)。另:过失误差另:过失误差(1)系统误差系统误差(systematic error):指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。流行病学称之为流行病学称之为偏倚偏倚(bias)。)。(2)随机误差随机误差(random error):由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。随机测量误差n在原始资料收集过程中,由于各种偶然因素影响造成的同一对象多次测量结果间不一致。n特点:没有固定倾向n处理:应采取措施控制在一定允许范围内随机误差随机误差(random error):抽

15、样误差(抽样误差(sampling errorsampling error)由于抽样不同)由于抽样不同引起的样本指标(统计量)与总体指标引起的样本指标(统计量)与总体指标(参数)之间的差别。(参数)之间的差别。特点:有抽样,抽样误差就不可避免。处理:可通过统计方法估计、频率(frequency)与概率(probability)n频率:在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。常用f表示。n 投掷硬币试验试验者投掷次数(n)出现正面次数(m)频率(m/n)Demorgen204610610.5186Buffon404020480.5096Pearson12

16、00060190.5016Pearson24000120120.5005n频率的稳定性:设在相同条件下,进行大频率的稳定性:设在相同条件下,进行大量重复试验,若事件量重复试验,若事件A的频率稳定地在某一的频率稳定地在某一确定值确定值p的附近摆动,则的附近摆动,则p为事件为事件A的概率。的概率。n概率:描述某一事件发生的可能性大小的概率:描述某一事件发生的可能性大小的数值,常用数值,常用P来表示。来表示。nP的大小在0和1之间。小概率事件及小概率原理统计学中的许多结论是带有概率性质的。通常一个事件的发生P0.05或P0.01,就叫小概率事件小概率事件。小概率原理:小概率原理:小概率事件在一次试验

17、中不会小概率事件在一次试验中不会发生。是统计推断的一条重要原理。发生。是统计推断的一条重要原理。、变量及变量值n变量(变量(variable):观察对象的特征或指标称为变):观察对象的特征或指标称为变量。量。n对变量进行测量或观察的结果称变量值。对变量进行测量或观察的结果称变量值。如:身高:172cm 体重:65Kg 性别:男 年龄:30岁 职业:教师、(警察)血型:A 尿蛋白:+三、统计资料的类型n1、根据变量类型划分:n数值变量:numerical variable 构成:计量资料 measurement datan分类变量:categorical variable 无序分类变量:计数资料

18、 enumeration data 有序分类变量:等级资料 rank datan(1)计量资料)计量资料(measurement data)用仪器、工具等测量方法获得的资料,即用仪器、工具等测量方法获得的资料,即为为计量资料计量资料。也叫。也叫数值变量资料数值变量资料或或定量资定量资料料。特点:特点:有计量单位有计量单位,如患者的身高(,如患者的身高(cm)、)、体重(体重(kg)、血压()、血压(mmHg)、脉搏(次)、脉搏(次/分)、红细胞计数(分)、红细胞计数(10/L)n(2)计数资料)计数资料(enumeration data)(enumeration data)n定义:定义:按某种

19、属性分类(分类间无大小、高按某种属性分类(分类间无大小、高低),然后清点每类的数据,称计数资料低),然后清点每类的数据,称计数资料 或无序分类资料。属定性资料。或无序分类资料。属定性资料。n特点特点:无固有计量单位,如肤色(黑、白)、血无固有计量单位,如肤色(黑、白)、血型(型(ABO)、职业(工农兵)、性别(男女)、职业(工农兵)、性别(男女)多为间断性资料多为间断性资料 (通过枚举或记数得来)(通过枚举或记数得来)n(3)等级资料()等级资料(rank data)定义:定义:半定性或半定量的观察结果。半定性或半定量的观察结果。按某种属性分类,分类间按某种属性分类,分类间有有大小顺序,所以也

20、叫大小顺序,所以也叫有序分类资料有序分类资料(ordinal category ordinal category datadata)。)。癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。尿蛋白:尿蛋白:,+,+,+,+及以上及以上特点:特点:每一个观察单位没有确切值每一个观察单位没有确切值分类各组之间有性质上的差别或程度上的不同。分类各组之间有性质上的差别或程度上的不同。2、根据测量的整数间有无小数划分n连续性资料:身高、体重等数据n非连续性(离散)资料:龋齿个数,病人数 离散型定量变量的频数分布 例 1998年某山区96名孕妇产

21、前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,4,7。这是什么类型这是什么类型变量?变量?这是什么类型这是什么类型变量?变量?这是什么类型这是什么类型变量?变量?3.三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等等级级资资料料计数资料计数资料小结:n1 1、重点掌握几个统计学中的基本概念:、重点掌握几个统计学中的基本概念:总体、样本、随机抽样误差、总体、样本、随机抽样误差、概率、变量概率、变量n2 2、掌握根据是否定量划分统计资料类型:、掌握根据是否定量划分统计资料类型:计量计量 计数计数 等级等级

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服