1、医学医学统计学学总结1.统计学的任学的任务l结合专业知识和具体要求进行统计研究设计l按照设计要求收集和整理资料l对所收集的资料进行统计处理l对统计处理的结果进行分析和解释2.统计结果是否可靠取决于果是否可靠取决于以下几个方面以下几个方面l调查或实验设计是否周密完善,是否按设计要求实施l所选用的指标是否特异性和客观性强,灵敏度和精确度高l数据是否真实可靠,样本含量是否足够大l所选用的统计方法是否妥当l结果解释是否正确3.选择统计分析方法流程分析方法流程研究目的研究目的设计类型型资料料类型型统计分析目的分析目的病例分析 疗效分析 寻找病因 关系探讨调查研究:横断面研究 回顾性研究 前瞻性研究实验研
2、究:完全随机设计 随机区组设计定量资料 定性资料 等级资料统计描述:统计表 统计图 统计指标统计推断:参数估计 假设检验4.统计分析方法分析方法运算运算报告告见后手工运算统计软件:SAS SPSS统计结论专业结论5.医学医学统计学学学学习要点要点l统计学的基本概念和思维逻辑l各种统计方法适用于什么资料,对于资料所要求的条件l根据资料的性质和分析要求,应选用什么统计方法l如何组织数据,输入数据,建立数据文件l如何运用计算工具或软件进行统计计算l如何阅读软件的输出结果,选择所需要的部分写入论文l如何正确分析统计结论6.单变量定量量定量资料料统计描述描述l频数表(n较大时)l频数分布图(直方图)l统
3、计指标正正态分布或近似正分布或近似正态分布分布资料料:均数标准差倍数倍数资料;料;对数正数正态分布分布资料料:几何均数几何标准差偏偏态分布;分布未知;分布末端有不确定数据分布;分布未知;分布末端有不确定数据:中位数四分位数间距度量衡度量衡单位不同或位不同或单位相同但均数相差位相同但均数相差悬殊的多殊的多组资料料变异度比异度比较:变异系数7.单变量定量量定量资料料统计推断推断参数估参数估计l总体均数点估计:l总体均数区间估计:n较小时:n较大时:注意可信区间和参考值范围的区别总体样本8.单变量定量量定量资料料统计推断推断假假设检验1.样本均数与总体均数比较样本来自正本来自正态分布或分布或变换后后
4、为正正态t检验Wilcoxon符号秩检验YN9.单变量定量量定量资料料统计推断推断假假设检验2.配对设计两均数比较差差值正正态或或变换后正后正态配配对t检验Wilcoxon符号秩检验YN10.单变量定量量定量资料料统计推断推断假假设检验3.完全随机设计两均数比较正正态性性方差方差齐性性两两样本本t检验近似近似t检验Wilcoxon秩和秩和检验反反应变量量为生存生存时间且含有截尾数据且含有截尾数据log-rank检验YN11.单变量定量量定量资料料统计推断推断假假设检验4.完全随机设计多均数比较正正态性性方差方差齐性性完全随机完全随机设计方差分析方差分析Kruskal-Wallis秩和秩和检验反
5、反应变量量为生存生存时间且含有截尾数据且含有截尾数据log-rank检验YN12.单变量定量量定量资料料统计推断推断假假设检验5.随机区组设计多均数比较正正态性性方差方差齐性性随机区随机区组设计方差分析方差分析Friedman秩和秩和检验YN13.单变量定量量定量资料料统计推断推断假假设检验6.多个样本均数的两两比较完全两两比较:SNK法部分两两比较:多个实验组与一个对照组比较 LSD法;Duncan新法14.定量定量资料分析中常料分析中常见的的错误l误将定量资料判为定性资料 为探讨雌激素受体(ER)、孕激素受体(PR)在小儿皮肤血管瘤发生、发展中的意义,采用免疫组化方法对毛细血管瘤、海绵状血
6、管瘤、淋巴管瘤及正常皮肤组织的ER、PR受体进行检测。全部标本经10福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4-6m切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率,此阳性细胞百分率为定量资料而不是定性资料。15.定量定量资料分析中常料分析中常见的的错误l忽视t检验、方差分析的前提条件 直肠癌手术前后3项肿瘤标志检测结果不同时期 CEA CA19-9 CA71-4术前(n=58)34.079.0 209.0 739.0 7.2 4.8术后(n=30)2.0 1.2 11.0 10.9 4.3 2.8转移复发(n=19)88.0 107.0 212
7、.0 529.0 9.8 3.2 此资料中若干个单元格中标准差的数值是均值的2倍以上,基本可以认为不服从正态分布,而且不同组间标准差也相差悬殊,也不满足方差齐性的要求,所以不宜采用方差分析。16.定量定量资料分析中常料分析中常见的的错误l误用多次t检验进行多组均数之间的比较 三菱莪术液抑癌实验的小鼠瘤重(g)组别 均数标准差 对照组 4.66 1.01 0.5ml 2.50 0.93 1.0ml 2.46 1.18 1.5ml 1.87 1.1617.定量定量资料分析中常料分析中常见的的错误l误将方差分析结论加以扩展 方差分析结果P0.99)。本资料的自变量是人为选定的布比卡因的浓度,并不是随
8、机变量,因而属于I型回归资料,并不适合作直线相关分析。可进行直线回归分析,求出回归方程,并进一步作假设检验,看两变量之间有无直线变化趋势。34.双双变量量统计分析中常分析中常见的的错误l散点图并不反映直线趋势,仍作直线相关分析 “高脂餐后内皮依赖性血管舒张功能变化及其影响因素”一文中,作者对75名受试者测定了餐后2h血清甘油三酯(TG)浓度增高值与餐后内皮依赖性血管功能下降值(),经相关分析,认为餐后2h血清TG浓度增高值与餐后内皮依赖性血管功能下降值显著正相关(r=0.459,P0.01)。进行直线相关分析前,应绘制散点图。本资料散点图无明显的直线变化趋势,并不适合作直线相关分析。另外决定系
9、数R2=0.4592=0.21,说明餐后2h血清TG浓度增高值可解释餐后内皮依赖性血管功能下降值变异的21,即两变量之间的关系实际意义不大。35.多多变量量统计分析分析1.应变量Y为正态分布数值变量 多重多重线性回性回归2.应变量Y为二分类(或多分类)定性变量或等级变量 logistic回回归3.应变量Y为二分类结局变量和生存时间 Cox回回归36.多多变量量统计分析分析用途:l多因素分析l平衡(调整)其它影响因素后的组间比较l预测预报37.多多变量量统计分析中常分析中常见的的错误l用单因素分析取代多因素分析l多变量筛选的策略错误 多因素分析时,先进行单因素分析,再将有统计意义的变量进行多变量
10、分析,这是一种错误的分析策略。单变量分析中表现的不仅是变量自身的作用,还可能有其它变量的混杂作用,其结果只起参考作用。在多元回归中每个自变量对应变量的贡献也与其它自变量是否被选入模型有关。正确的做法是考虑所有的变量,采用逐步回归方法,必要时多用几种筛选变量的技术,同时还要考虑因素之间的交互作用,综合分析,得出较为可靠的结果。38.多多变量量统计分析中常分析中常见的的错误l不会用多因素分析方法平衡混杂因素对结果的影响 例:分析急性白血病患者具有某种不良染色体是否与其缓解有关,可采用logistic回归平衡混杂因素如年龄、性别、骨髓原幼细胞数、cd34表达等对缓解的影响。如同时考虑缓解时间,可采用
11、Cox回归。39.医学医学论文文统计表达的基本要求表达的基本要求l摘要l引言l材料与方法l结果l讨论40.一、摘要一、摘要l摘要是研究核心内容的浓缩,简述研究目的、方法、结果和结论。l摘要中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差、率、P值或两组均数(率)之差、95可信区间、OR(RR)值等。41.二、材料与方法二、材料与方法除专业方面的描述外,统计学描述包括以下两个方面。1.清晰地描述研究清晰地描述研究设计的内容,包括研究的内容,包括研究类型、型、观察察对象象类型、入型、入选和剔除和剔除标准、准、观察方法和察方法
12、和测量技量技术以及以及实验、试验或或调查资料的搜集料的搜集过程等。程等。尤其应具体地描述研究对象的来源和选择方法、包括观察对象的基本情况、有无随机分组(随机抽样)、样本含量及其估计的依据等。若进行了随机化分组,应说明具体的随机化方法。对于非随机化分组的观察性研究,除要明确说明观察对象的选择方法外,还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对临床试验,还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、有无失访及失访的比例、有无“知情同意”、是否盲法观察等。42.2.说明所采用的明所采用的统计分析方法与分析方法与统计计算算软件。件。数据处理用到的所有统计方法都要说明。
13、如果用了几种统计方法,必须清楚地指出在何处用了何种方法。常用的统计方法简单说明即可,如t检验、单变量方差分析、卡方检验等,对一些特殊的统计方法,如生存分析、重复测量资料方差分析、协方差分析等,要同时给出相应的参考文献。统计计算软件一般给出名称即可,如SPSS、SAS等,但对于一些特殊的计算,要给出软件的过程名,如重复测量资料方差分析采用SPSS/GLM等。43.三、三、结果果l统计结果主要用统计指标(统计量)表示。统计指标比较多时,如分组比较,要借助统计表和统计图。l假设检验的结果表达 不能仅仅给出P值,还要求给出检验统计量的值,如t值等。由于统计软件的普及,提倡报告P的具体数值,如P=0.0
14、18或P=0.436等。44.四、四、讨论 统计结果的解释主要集中在论文的“讨论”部分。作者往往要在“讨论”部分引用统计结果作为支持其新发现、新结果、新观点的统计学依据,对统计结果理解和解释上的偏差,可能导致结论上的错误。45.1.假设检验结果的解释l 即使疗效显著,当观察的数据很少时,也极有可能出现无统计学意义的结果;相反,疗效差别很小时(如新药比对照药有效率仅提高了0.1),大样本数据也可能出现有统计学意义的结果。因此,有统计学意义并不等同于临床上的疗效显著。lP值越小,不能说明比较的两均数(或率)之间差别越大;也不能说明两变量的关系越密切。46.2.关联与因果l在观察性研究中,变量间的关
15、联或组间差别可能是因果关系,也可能是偏倚,确定因果关系需要根据专业知识进行进一步的分析。l在随机对照研究中,变量间的关联和组间差别可以解释为有概率保证的因果关系。l当变量都随时间变化时,变量间很容易出现虚假的相关关系,必须特别加以小心。47.3.数字变化l对于数字的增加可用倍数和百分数表示。如增加了2倍,即原来为5,现在为15;增加到2倍,即原来为5,现在为10;增加了20,即原来为5,现在为6。l对于数字的减少只能用百分数或分数表示。如降低了20,即原来为5,现在为4;降低到20,即原来为5,现在为1;减少了1/2,即原来为5,现在为2.5。48.4.缺陷或不足 要指出在研究设计和实施过程中
16、有哪些缺陷或不足。若发现缺陷或不足,则应考虑这些缺陷或不足对结果和解释可能产生的影响。不能对缺陷或不足视而不见,更不能寄希望于不被读者发现。49.后面内容直接删除就行资料可以编辑修改使用资料可以编辑修改使用50.主要经营:网络软件设计、图文设计制作、发布广告等公司秉着以优质的服务对待每一位客户,做到让客户满意!51.致力于数据挖掘,合同简历、论文写作、PPT设计、计划书、策划案、学习课件、各类模板等方方面面,打造全网一站式需求52.感感谢您的您的观看和下看和下载The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider field53.