收藏 分销(赏)

医学统计学数据处理的一般原则与方法第29章课件.ppt

上传人:精*** 文档编号:1776278 上传时间:2024-05-09 格式:PPT 页数:58 大小:700.02KB
下载 相关 举报
医学统计学数据处理的一般原则与方法第29章课件.ppt_第1页
第1页 / 共58页
医学统计学数据处理的一般原则与方法第29章课件.ppt_第2页
第2页 / 共58页
医学统计学数据处理的一般原则与方法第29章课件.ppt_第3页
第3页 / 共58页
医学统计学数据处理的一般原则与方法第29章课件.ppt_第4页
第4页 / 共58页
医学统计学数据处理的一般原则与方法第29章课件.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

1、数据处理的数据处理的数据处理的数据处理的一般原则与方法一般原则与方法一般原则与方法一般原则与方法第第29章章第二军医大学卫生统计学教研室第二军医大学卫生统计学教研室 张罗漫张罗漫5/5/20241医学统计学讲课内容:讲课内容:讲课内容:讲课内容:第一节第一节第一节第一节 医学统计学概述医学统计学概述医学统计学概述医学统计学概述(重点重点重点重点)第二节第二节第二节第二节 原始数据的录入原始数据的录入原始数据的录入原始数据的录入第三节第三节第三节第三节 数据处理的几个基本问题数据处理的几个基本问题数据处理的几个基本问题数据处理的几个基本问题第四节第四节第四节第四节 统计方法选择的基本思路统计方法

2、选择的基本思路统计方法选择的基本思路统计方法选择的基本思路(重点重点重点重点)5/5/20242医学统计学第一节第一节第一节第一节医学统计学概述医学统计学概述医学统计学概述医学统计学概述5/5/20243医学统计学医学统医学统计计 学学研究研究设计设计数据数据处理处理观察性研究观察性研究实验性研究实验性研究统计描述统计描述统计推论统计推论假设检验假设检验参数估计参数估计(调查调查)5/5/20244医学统计学调查设计调查设计调查方法调查方法调查对象调查对象 调查指标调查指标研究目的研究目的按范围按范围按时间按时间抽样抽样普查普查横向横向(现况调查现况调查)非概率非概率概概 率率简单随机简单随机

3、系统系统 分层随机分层随机 整群整群纵向纵向病例对照研究病例对照研究队列研究队列研究 调查工具调查工具 调查员调查员5/5/20245医学统计学实验设计实验设计实验分类实验分类动物实验动物实验临床试验临床试验社区干预试验社区干预试验基本要素基本要素处理因素处理因素受试对象受试对象实验效应实验效应5/5/20246医学统计学实验设计实验设计随机化随机化基本原则基本原则对对 照照重重 复复(样本含量样本含量)设置设置原则:原则:均衡可比均衡可比 类型:类型:配对、组间配对、组间 1-1-、空白空白实验实验安慰剂安慰剂标准标准相互相互5/5/20247医学统计学统计描述统计描述统计表统计表制表原则制

4、表原则制表要求制表要求 简单明了简单明了主语在左、宾语在右主语在左、宾语在右一张表表达一个中心内容一张表表达一个中心内容备注备注数字数字 线条线条 标目标目标题标题5/5/20248医学统计学统计描述统计描述统计图统计图制图原则制图原则制图要求制图要求 连续性资料:连续性资料:间断性资料:间断性资料:图例图例刻度刻度 纵轴、横轴纵轴、横轴 标目标目标题标题 条图、圆图、百分比条图条图、圆图、百分比条图 线图、直方图、散点图线图、直方图、散点图5/5/20249医学统计学统计描述统计描述 统计统计指标指标计量资料计量资料(单变量单变量)中心中心位置位置 正态:正态:非正态:非正态:对数正态:对数

5、正态:离散离散 程度程度 个体值个体值 样本均数:样本均数:正态正态非正态非正态:量纲相同量纲相同:量纲不同量纲不同:计量资料计量资料(双变量双变量)离散程度:离散程度:r、b5/5/202410医学统计学统计描述统计描述 中心位置:均数向量中心位置:均数向量离散程度:离均差矩阵离散程度:离均差矩阵 协方差矩阵协方差矩阵相互关系:相关矩阵相互关系:相关矩阵计量资料计量资料(多变量多变量)统计统计指标指标5/5/202411医学统计学统计描述统计描述等级等级资料资料统计统计指标指标计数资料计数资料绝对数、率、构成比、绝对数、率、构成比、相对比相对比 、RR(OR)离散程度:离散程度:标准误标准误

6、离散程度:离散程度:秩号、秩和秩号、秩和秩和的标准误秩和的标准误单变量单变量双变量:双变量:rs5/5/202412医学统计学统计描述统计描述参参 考考 值值 范围估计范围估计正态正态偏态偏态或或双侧:双侧:单侧:单侧:双侧:双侧:单侧:单侧:或或5/5/202413医学统计学统计推论统计推论参数参数估计估计区间区间估计估计点估计点估计双侧:双侧:单侧:单侧:或或双侧:双侧:单侧:单侧:或或RR(OR):5/5/202414医学统计学统计推论统计推论假设假设检验检验步骤步骤1.进行检验假设进行检验假设 假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准 确定最大允许误

7、差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量 计算样本与总体的偏离程度计算样本与总体的偏离程度4.根据一特定分布计算与检验统计根据一特定分布计算与检验统计 量对应的量对应的P值值5.作出结论作出结论 根据小概率反证法思想作出推断根据小概率反证法思想作出推断5/5/202415医学统计学统计推论统计推论比较比较差别:差别:2、t、u、F、q、log-rank 、秩和检验等秩和检验等联系:相关、回归分析联系:相关、回归分析分类:聚类、回归分析分类:聚类、回归分析鉴别:判别分析鉴别:判别分析推测:回归分析推测:回归分析筛选影响因素:回归分析筛选影响因素:回归分析综合变量

8、信息:主成分分析综合变量信息:主成分分析寻找潜在支配因素:因子分析寻找潜在支配因素:因子分析假设假设检验检验方法方法5/5/202416医学统计学第二节第二节第二节第二节原始数据的录入原始数据的录入原始数据的录入原始数据的录入5/5/202417医学统计学一、原始数据的记录形式一、原始数据的记录形式行:观察单位行:观察单位 列:变量列:变量5/5/202418医学统计学标识变量标识变量分析变量分析变量5/5/202419医学统计学标识变量标识变量分析变量分析变量解释变量解释变量反应变量反应变量5/5/202420医学统计学二、原始数据的录入二、原始数据的录入文件类型:文件类型:数据库文件:数据

9、库文件:EpitaDa dBASE、FoxBASE、Foxprow Oracle Excel文件:文件:Excel文本文件:文本文件:Word统计软件数据文件:统计软件数据文件:SPSS、SAS、STATA变量名的定义:变量名的定义:变量值的量化:变量值的量化:5/5/202421医学统计学第三节第三节第三节第三节数据处理数据处理数据处理数据处理的几个基本问题的几个基本问题的几个基本问题的几个基本问题5/5/202422医学统计学一、数据的净化一、数据的净化 逻辑检查逻辑检查 计算检查计算检查二、离群数据的处理二、离群数据的处理 离群值离群值(outliner)与与P25或或P75的距离为的距

10、离为“四分位数间距四分位数间距”的的1.53.0倍。倍。极端值极端值(extreme value)与与P25或或P75的的距离为距离为“四分位数间距四分位数间距”的的3.0倍以上倍以上。剔除离群或极端值要予以合理解释。剔除离群或极端值要予以合理解释。5/5/202423医学统计学三、统计方法前提条件的检验三、统计方法前提条件的检验 多样本比较的方差分析:多样本比较的方差分析:独立独立 正态分布正态分布 方差齐性方差齐性 多重线性回归分析:多重线性回归分析:变量间无多重共线变量间无多重共线 残差分布正态残差分布正态 5/5/202424医学统计学第四节第四节第四节第四节统计方法选择统计方法选择统

11、计方法选择统计方法选择的基本思路的基本思路的基本思路的基本思路5/5/202425医学统计学根据:根据:根据:根据:医学专业知识医学专业知识医学专业知识医学专业知识医学统计学知识医学统计学知识医学统计学知识医学统计学知识计算机统计软件技术计算机统计软件技术计算机统计软件技术计算机统计软件技术5/5/202426医学统计学设计类型:设计类型:完全随机、随机区组、拉丁方、完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计交叉、析因、正交、嵌套、裂区设计处理因素:处理因素:单因素、双因素、多因素单因素、双因素、多因素反应变量:反应变量:单变量、双变量、多变量单变量、双变量、多变量资料类型:

12、资料类型:计量、无序分类、有序分类计量、无序分类、有序分类样本数目:样本数目:单样本、两样本、多样本单样本、两样本、多样本数据提供信息:数据提供信息:完全数据、不完全数据、完全数据、不完全数据、重复测量数据重复测量数据假设检验方法前提条件:假设检验方法前提条件:独立、方差齐性、正态分布独立、方差齐性、正态分布重要重要5/5/202427医学统计学一、单变量计量资料一、单变量计量资料1.样本均数与总体均数比较样本均数与总体均数比较 单因素单因素 服从正态分布服从正态分布 单样本单样本t检验检验 可信区间法可信区间法 不服从正态分布不服从正态分布 单个样本中位数与总体中位数比较单个样本中位数与总体

13、中位数比较5/5/202428医学统计学2.两个相关样本均数的比较两个相关样本均数的比较 单因素单因素 配对设计或自身前后对照设计配对设计或自身前后对照设计 差值服从正态分布差值服从正态分布 成对成对t t检验检验 可信区间法可信区间法 差值不服从正态分布差值不服从正态分布 Wilcoxon符号秩检验符号秩检验一、单变量计量资料一、单变量计量资料1-可信区间不可信区间不包括包括 d=0,P T 1 Pearson 2 检验检验 (Yates 校正公式校正公式)N40 或或 T 1 Fisher 确切概率法确切概率法 (2)配对设计配对设计 McNemar 2 检验检验Logistic回归分析回

14、归分析5/5/202439医学统计学Y(疗效疗效)=1 有效有效0 无效无效X1(试验因素试验因素)=1 有有0 无无组别组别 疗效疗效 频数频数 1 1 99 1 2 5 2 1 75 2 2 21数据输数据输入格式入格式5/5/202440医学统计学3.R C列联表列联表 相关、相差相关、相差 (1)双向有序双向有序备择假设:行变量与列变量为非零相关备择假设:行变量与列变量为非零相关 Cochran-Mantel-Haenszel 2 检验检验有序分组资料的线性趋势检验有序分组资料的线性趋势检验 2 回归回归 (2)单向单向(反应变量反应变量)有序有序备择假设:行平均得分不同备择假设:行平

15、均得分不同 Cochran-Mantel-Haenszel 2 检验检验Wilcoxon 秩和检验秩和检验二、计数资料二、计数资料5/5/202441医学统计学3.R C列联表列联表 相关、相差相关、相差 (3)双向无序双向无序备择假设:行变量与列变量有一般关联备择假设:行变量与列变量有一般关联 Cochran-Mantel-Haenszel 2 检验检验Pearson 2 检验检验二、计数资料二、计数资料5/5/202442医学统计学1.配对设计配对设计 Wilcoxon符号秩检验符号秩检验2.两组独立样本两组独立样本 Wilcoxon两两样本秩和检验样本秩和检验3.完全随机设计多个样本比较

16、完全随机设计多个样本比较 Kruskal-Wallis H 检验检验4.随机区组设计多个样本比较随机区组设计多个样本比较 Friedman M 检验检验三、等级资料三、等级资料5/5/202443医学统计学1.相关分析相关分析 X1与与X2服从二元正态分布服从二元正态分布 Pearson积差相关分析积差相关分析 X1与与X2不服从二元正态分布不服从二元正态分布 Spearman秩相关分析秩相关分析2.回归分析回归分析 Y与与X服从二元正态分布服从二元正态分布 或或 Y服从正态分布而服从正态分布而X为控制变量为控制变量 Y与与X间呈直线趋势间呈直线趋势 直线回归分析直线回归分析四、双变量资料四、

17、双变量资料5/5/202444医学统计学3.曲线回归分析(曲线回归分析(SPSS)5/5/202445医学统计学3.曲线回归分析(曲线回归分析(SPSS)5/5/202446医学统计学4.协方差分析协方差分析比较带有协变量比较带有协变量(Xj)的各组均数的各组均数()间的差别间的差别协变量协变量Xj对对Yj有影响有影响分为完全随机设计与随机区组设计分为完全随机设计与随机区组设计5/5/202447医学统计学1.有应变量的多元分析有应变量的多元分析五、多变量资料五、多变量资料5/5/202448医学统计学1.有应变量的多元分析有应变量的多元分析 Y为计量资料且服从正态分布为计量资料且服从正态分布

18、 自变量服从多元正态分布自变量服从多元正态分布 多元线性回归或多元逐步回归分析多元线性回归或多元逐步回归分析五、多变量资料五、多变量资料5/5/202449医学统计学1.有应变量的多元分析有应变量的多元分析 Y为判别分类变量为判别分类变量 自变量服从多元正态分布自变量服从多元正态分布 判别分析或逐步判别分析判别分析或逐步判别分析五、多变量资料五、多变量资料5/5/202450医学统计学1.有应变量的多元分析有应变量的多元分析 Y为二分类或多分类变量为二分类或多分类变量 以分析危险因素为主要目的以分析危险因素为主要目的 条件或非条件条件或非条件Logistic回归分析回归分析五、多变量资料五、多

19、变量资料5/5/202451医学统计学1.有应变量的多元分析有应变量的多元分析 Y为生存时间且含有截尾数据为生存时间且含有截尾数据 Cox比例风险回归分析比例风险回归分析五、多变量资料五、多变量资料5/5/202452医学统计学2.无应变量的多元分析无应变量的多元分析五、多变量资料五、多变量资料5/5/202453医学统计学2.无应变量的多元分析无应变量的多元分析 将将n个观察单位聚为个观察单位聚为k类类(n k)Q型聚类型聚类 将将m个个变量聚为变量聚为k类类(m k)R型聚类型聚类 五、多变量资料五、多变量资料5/5/202454医学统计学2.无应变量的多元分析无应变量的多元分析 将所有变

20、量化为少数几个互不相关的综合将所有变量化为少数几个互不相关的综合 变量变量 主成分分析主成分分析 从所有变量中找出有限个不可观测的潜在从所有变量中找出有限个不可观测的潜在 因素因素 因子分析因子分析 五、多变量资料五、多变量资料5/5/202455医学统计学2.无应变量的多元分析无应变量的多元分析 分析一个变量与一组变量的相关关系分析一个变量与一组变量的相关关系 多元线性相关分析多元线性相关分析 分析一组变量与另一组变量的相关关系分析一组变量与另一组变量的相关关系 典型相关分析典型相关分析五、多变量资料五、多变量资料5/5/202456医学统计学讲课内容:讲课内容:讲课内容:讲课内容:第一节第一节第一节第一节 医学统计学概述医学统计学概述医学统计学概述医学统计学概述(重点重点重点重点)第二节第二节第二节第二节 原始数据的录入原始数据的录入原始数据的录入原始数据的录入第三节第三节第三节第三节 数据处理的几个基本问题数据处理的几个基本问题数据处理的几个基本问题数据处理的几个基本问题第四节第四节第四节第四节 统计方法选择的基本思路统计方法选择的基本思路统计方法选择的基本思路统计方法选择的基本思路(重点重点重点重点)5/5/202457医学统计学Thank you!5/5/202458医学统计学

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服