资源描述
课程主要内容广告市场调查的基本理论知识现实问题转换为可处理问题的方法问卷设计方法(实习)数据收集、录入、变换方法SPSS基本操作方法(主要包括均值、方差分析、回归分析、卡方检验、非参数检验等)课程主要教学和学习方法共计48个学时,其中32个学时是讲授、16个学时上机,第7周时课外实践课。每次课程的内容以讲授为主,根据实际讲授情况,课堂上需要阅读关键部分内容。12-15周上午1-4节课是上机,在学院多媒体机房,8:00 阳光 12:00问卷设计和编写为本课程的实习内容。第一章 一些基本概念什么是统计呢?什么是统计呢?报表报表?数字数字?你觉得你们需要统计吗?你觉得你们需要统计吗?为什么为什么?1.1 统计是什么?统计是什么?统计是人类思维的一个归纳过程统计是人类思维的一个归纳过程站在一个路口,看到每过去站在一个路口,看到每过去20辆小轿车时,也辆小轿车时,也有有100辆自行车通过辆自行车通过而且平均每而且平均每10个轿车载有个轿车载有12个人个人于是,你认为小汽车和自行车在这个路口的运于是,你认为小汽车和自行车在这个路口的运载能力为载能力为24:100这是一个典型的统计思维过程这是一个典型的统计思维过程1.1 统计是什么?统计是什么?一般来说,统计先从现实世界收集数据(信息)一般来说,统计先从现实世界收集数据(信息),如观测路口的交通,如观测路口的交通然后,根据数据作出判断,称为模型然后,根据数据作出判断,称为模型模型是从数据产生的模型是从数据产生的模型也需要根据新的信息来改进模型也需要根据新的信息来改进不存在完美的模型不存在完美的模型模型的最终结局都是被更能够说明现实世界的模型的最终结局都是被更能够说明现实世界的新模型所取代新模型所取代统计学可以应用于几乎所有的领域统计学可以应用于几乎所有的领域:精算,农业,动物学,人类学,考古学,审计学,晶精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,经济计量学,体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,流行病学,金融,教育学,选举预测和策划,工程,流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气劳动力计划,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全管理,眼科学,制药学,象学,军事科学,核材料安全管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量控制,物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,气象改善,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。博彩等。1.1 统计是什么?统计是什么?统统计计学学(statistics)是是用用以以收收集集数数据据,分分析析数数据和由数据得出结论的一组概念、原则和方法。据和由数据得出结论的一组概念、原则和方法。以以归归纳纳为为主主要要思思维维方方式式的的统统计计不不是是以以演演绎绎为为主的主的数学数学统统计计可可应应用用于于各各个个不不同同学学科科,在在有有些些学学科科已已经经有有其其特特有有的的方方法法和和特特点点;如如生生物物统统计计(biostatistics)、经经济济计计量量学学(econometrics)以以及及目目前前很很热热门门的的生生物物信信息息(bioinformation)和和数数据据挖挖掘掘(Data Mining)的的方方法法主主体体都都是是统统计。计。你想过下面的问题吗?你想过下面的问题吗?当当你你买买了了一一台台电电视视时时,被被告告知知三三年年内内可可以以免免费费保保修修。你你想想过过厂厂家家凭凭什什么么这这样样说说吗吗?说说多多了了,厂厂家家会会损损失失;说说少少了了,会会失失去去竞竞争争,也也是是损损失失。到到底底这个保修期是怎样决定的呢?这个保修期是怎样决定的呢?大大学学排排名名是是一一个个非非常常敏敏感感的的问问题题。不不同同的的机机构构得得出出不不同同的的结结果果;各各自自都都说说自自己己是是客客观观、公公正正和和有有道理的。到底如何理解这些不同的结果呢?道理的。到底如何理解这些不同的结果呢?你想过下面的问题吗?你想过下面的问题吗?任任何何公公司司都都有有一一个个信信用用问问题题。当当然然,在在这这些些公公司司试试图图得得到到贷贷款款时时并并没没有有不不还还贷贷的的不不良良记记录录。如如何何根根据据它它们们的的财财务务和和商商业业资资料料来来判判断断一一个个公公司司的的信信用等级呢?用等级呢?我我国国南南部部和和北北部部的的概概念念是是一一个个比比较较笼笼统统的的概概念念。如如何何能能够够根根据据需需要要,选选择择一一些些指指标标来来把把各各省省,或或各市县甚至村进行分类呢?各市县甚至村进行分类呢?(南北地理分界标志南北地理分界标志)疾疾病病传传播播时时,如如何何能能够够通通过过感感染染者者入入院院前前后后的的各各种因素得到一个疾病传染方式的模型呢?种因素得到一个疾病传染方式的模型呢?你想过下面的问题吗?你想过下面的问题吗?如如何何通通过过大大众众调调查查来来得得到到性性别别、年年龄龄、职职业业、收收入入等等各各种种因因素素与与公公众众对对某某项项事事物物(比比如如商商品品或或政政策)的态度的关系呢?策)的态度的关系呢?一一个个从从来来没没有有研研究究过过红红楼楼梦梦的的统统计计学学家家如如何何根根据据比比较较写写作作习习惯惯得得出出红红楼楼梦梦从从哪哪一一段段开开始始就就不不是是曹曹雪芹的手笔了呢?雪芹的手笔了呢?如如何何才才能能够够客客观观地地得得到到某某个个电电视视节节目目的的收收视视率率,以确定广告的价格是否合理呢?以确定广告的价格是否合理呢?你如何理解下面说法?你如何理解下面说法?“明天降水概率为明天降水概率为4040”“我冬天去新加坡度假的概率为我冬天去新加坡度假的概率为1010”“该节目收视率是该节目收视率是30%30%”“调查结果表明调查结果表明20%20%的观众喜欢某节目的观众喜欢某节目”“抽样调查结果的误差为抽样调查结果的误差为3%3%”“支持率的支持率的9595置信区间为置信区间为(25%,30%)(25%,30%)”“某学校排名第一某学校排名第一”“某县是贫困县某县是贫困县”你如何理解下面说法?你如何理解下面说法?“某国的综合竞争力排名第某国的综合竞争力排名第4343位位”“该国家属于发展中国家该国家属于发展中国家”“该药品疗效该药品疗效99%99%”“该国贫富差距大该国贫富差距大”“这个县收入比那个县高这个县收入比那个县高”“该结果统计显著该结果统计显著”“消费价格指数为消费价格指数为120%120%”“他的血压已经正常了他的血压已经正常了”可以想象出的统计应用例子可以想象出的统计应用例子如何确定观众如何确定观众/听众是否忠实于某节目听众是否忠实于某节目(专栏专栏)如何对电视节目排名次如何对电视节目排名次什么因素影响一个节目的收视率什么因素影响一个节目的收视率如何按照各种不同环境估计某商店的顾客人数如何按照各种不同环境估计某商店的顾客人数如何按照各种指标评价雇员如何按照各种指标评价雇员如何把地区如何把地区(市县镇等市县镇等)按照各种指标分类按照各种指标分类如何确定红楼梦第几回不是曹雪芹所写如何确定红楼梦第几回不是曹雪芹所写如何确定一个产品的可靠性如何确定一个产品的可靠性如何进行偏差较少的民意调查如何进行偏差较少的民意调查如何根据一些财务数据发现漏税的嫌疑单位如何根据一些财务数据发现漏税的嫌疑单位?你相信统计结果吗?你相信统计结果吗?数据可以有误或作假数据可以有误或作假统计方法(有意或无意)使用不当可以误导。有统计方法(有意或无意)使用不当可以误导。有低级误导和高级误导。低级误导和高级误导。常识判断和直觉是重要的常识判断和直觉是重要的关于美国选举的两个例子关于美国选举的两个例子(1)谁会在谁会在1936选举中获胜选举中获胜?Alf London还是还是 F.D.R.(罗斯福罗斯福)?Literary Digest(文摘文摘)送出一千万份问卷送出一千万份问卷(返回返回二百四十万份二百四十万份)后后,预测预测London 会赢会赢.而而Gallop(盖洛普盖洛普)只问了只问了5000人说人说 Roosevelt(罗斯福罗斯福)会赢会赢.最后罗斯福和盖洛普都赢了最后罗斯福和盖洛普都赢了.文摘文摘倒闭了倒闭了.谁会在谁会在1948选举中获胜选举中获胜?Thomas Dewey还是还是Harry Truman(杜鲁门杜鲁门)?Crossley,Gallop(盖洛普盖洛普),Roper所有都预测所有都预测Dewey 会赢会赢(每个机构用了每个机构用了5000个问卷个问卷).最后最后(包括盖洛普包括盖洛普)他们都输了他们都输了,而杜鲁门赢了而杜鲁门赢了.关于美国选举的两个例子关于美国选举的两个例子(2)统计的一些做法统计的一些做法统计可以指导我们收集数据统计可以指导我们收集数据.当拥有来自一些变量当拥有来自一些变量(指标指标)的数据或记录的数据或记录,但缺但缺乏模型来描述这些变量之间关系的情况下乏模型来描述这些变量之间关系的情况下,可用可用统计方法建立模型统计方法建立模型.在有了一定的模型时在有了一定的模型时,统计可以确定手中数据是统计可以确定手中数据是否令人信服地支持某种论点否令人信服地支持某种论点.模型也用来对未来模型也用来对未来进行预测进行预测.统计直观的图表展示统计直观的图表展示,可以使各个领域的专家容可以使各个领域的专家容易理解易理解中国统计的独特历史环境中国统计的独特历史环境中国统计过去分为中国统计过去分为“统计学统计学”(文科的列宁文科的列宁主义统计主义统计)和和“数理统计数理统计”(数学类的国际意数学类的国际意义上的统计义上的统计)国内一些学者把统计称为是经济学科的一部分,国内一些学者把统计称为是经济学科的一部分,则是中国特有的与前苏联关联的国情所造成;读则是中国特有的与前苏联关联的国情所造成;读者可以从者可以从苏联大百科全书苏联大百科全书的统计学条款得到的统计学条款得到答案。答案。但前苏联的经济学中的统计学概念是其意识形态但前苏联的经济学中的统计学概念是其意识形态和计划经济体系的产物,其模型多属于小学数学和计划经济体系的产物,其模型多属于小学数学水平,很难称为数学模型。水平,很难称为数学模型。这与现代经济学所需这与现代经济学所需要的大量的统计和数学形成鲜明对照要的大量的统计和数学形成鲜明对照.前苏联式的前苏联式的“统计学统计学”不是目前国际流行意义上不是目前国际流行意义上的统计学或统计学的分支。的统计学或统计学的分支。统计的内容和需要的知识统计的内容和需要的知识数学的几乎所有内容数学的几乎所有内容(不一定事先知道需要不一定事先知道需要什么什么)用计算机做统计计算用计算机做统计计算其他其他(对象对象)领域的知识领域的知识统计和数学的区别统计和数学的区别数学思维是以演绎为主数学思维是以演绎为主统计思维是以归纳为主统计思维是以归纳为主,兼有演绎兼有演绎统计各领域利用几乎所有存在的数学内容统计各领域利用几乎所有存在的数学内容.但统计本身的数学是为具体目标服务的但统计本身的数学是为具体目标服务的,自己一自己一般不形成数学体系般不形成数学体系计算机的重要性计算机的重要性由于统计和数据打交道由于统计和数据打交道,没有计算机的发展没有计算机的发展统计就没有前途统计就没有前途.计算机和统计的发展相辅相成计算机和统计的发展相辅相成1.2现实中的随机性和规律性现实中的随机性和规律性从中学起,我们就知道自然科学的许多定律,例如物理从中学起,我们就知道自然科学的许多定律,例如物理中的牛顿三定律,物质不灭定律以及化学中的各种定律中的牛顿三定律,物质不灭定律以及化学中的各种定律等等。等等。但是在许多领域,但是在许多领域,很难用如此确定的公式或论述来描述很难用如此确定的公式或论述来描述一些现象。一些现象。比如,人的寿命是很难预先确定的。一个吸比如,人的寿命是很难预先确定的。一个吸烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少得病、生活习惯良好的人活得长。得病、生活习惯良好的人活得长。因此,可以说,活得长短是有一定随机性的因此,可以说,活得长短是有一定随机性的(randomness)。这种随机性可能和人的经历、基因、。这种随机性可能和人的经历、基因、习惯等习惯等无数说不清的因素无数说不清的因素都有关系。都有关系。现实中的随机性和规律性现实中的随机性和规律性但是从总体来说,我国公民的平均年龄却是非常但是从总体来说,我国公民的平均年龄却是非常稳定的。而且女性的平均年龄也稳定地比男性高稳定的。而且女性的平均年龄也稳定地比男性高几年。这就是几年。这就是规律性规律性。一个人可能活过这个平均年龄,也可能活不到这一个人可能活过这个平均年龄,也可能活不到这个年龄,这是个年龄,这是随机的随机的。但是总体来说,平均年龄的稳定性,却说明了但是总体来说,平均年龄的稳定性,却说明了随随机之中有规律性机之中有规律性。这种规律就是统计规律。这种规律就是统计规律。概率和机会概率和机会你可能经常听到概率(你可能经常听到概率(probability)这个名词。例如在)这个名词。例如在天气预报中会提到降水概率。大家都明白,如果降水概天气预报中会提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。就不大可能下雨。因此,从某种意义说来,因此,从某种意义说来,概率描述了某件事情发生的机概率描述了某件事情发生的机会。会。显然,这种概率不可能超过百分之百,也不可能少于百显然,这种概率不可能超过百分之百,也不可能少于百分之零。换言之,分之零。换言之,概率是在概率是在0和和1之间的一个数之间的一个数,说明某,说明某事件发生的机会有多大。事件发生的机会有多大。有些概率是无法精确推断的有些概率是无法精确推断的比如你对别人说你下一个周末去公园的概率是百分之八比如你对别人说你下一个周末去公园的概率是百分之八十。十。其实你想说的是你很可能去,但又没有完全肯定。其实你想说的是你很可能去,但又没有完全肯定。实际上,到了周末,你或者去,或者不去;不可能有分实际上,到了周末,你或者去,或者不去;不可能有分身术把百分之八十的你放到公园,而其余的放在别处。身术把百分之八十的你放到公园,而其余的放在别处。有些概率是可以估计的有些概率是可以估计的比如掷骰子。只要没有人在骰子上做手脚,你得比如掷骰子。只要没有人在骰子上做手脚,你得到到6 6点的概率应该是六分之一。得到其他点的概点的概率应该是六分之一。得到其他点的概率也是一样。率也是一样。得到得到6 6的概率或者机会是可以知道的,但掷骰子的概率或者机会是可以知道的,但掷骰子的结果还的结果还只可能是六个数目之一。只可能是六个数目之一。这个已知的规律就反映了规律性,而得到哪个结这个已知的规律就反映了规律性,而得到哪个结果则反映了随机性。果则反映了随机性。如果你掷如果你掷10001000次骰子,那么,大约有六分之一的次骰子,那么,大约有六分之一的可能会得到可能会得到6 6;这也是随机性呈现有规律的一个这也是随机性呈现有规律的一个体现。体现。1.3 变量和数据变量和数据一一节节火火车车车车厢厢有有多多少少坐坐位位是是一一个个固固定定的的数数目目,称称为常数为常数(constant)或者常量。或者常量。但但是是,开开车车后后,坐坐在在这这节节车车厢厢的的旅旅客客有有多多少少就就没没准准了了。这这有有随随机机性性。该该车车厢厢的的乘乘客客数数为为变变量量(variable)。1.3 变量和数据变量和数据一一个个学学校校的的注注册册在在校校男男女女生生比比例例是是固固定定的的,为为常常量量但但是是,该该校校任任意意一一群群学学生生的的男男女女生生比比例例就就不不一一定定和全校的比例一样了,它为变量和全校的比例一样了,它为变量(variable)。1.3 变量和数据变量和数据当当变变量量按按照照随随机机规规律律所所取取的的值值是是数数量量时时该该变变量量称称为定量变量或数量变量为定量变量或数量变量(quantitative variable);因因 为为 是是 随随 机机 的的,也也 称称 为为 随随 机机 变变 量量(random variable)。如身高体重,购买某商品的人数等等如身高体重,购买某商品的人数等等1.3 变量和数据变量和数据像像性性别别,观观点点之之类类的的取取非非数数量量值值的的变变量量就就称称为为定定性性变变量量或或属属性性变变量量或或分分类类变变量量(qualitative variable,或或categorical variable)。这这些些定定性性变变量量也也可可以以由由定定量量变变量量来来描描述述,如如男男女女生生的的数数目目,持持有有某某观观点点的的人人数数比比例例等等。等等。1.3 变量和数据变量和数据定定性性变变量量只只有有用用数数量量来来描描述述时时,才才有有可可能能建立数学模型,并使用计算机来分析。建立数学模型,并使用计算机来分析。数数据据中中它它们们通通常常用用哑哑元元(dummy variable)代代表表,比比如如性性别别用用0、1代代表表,三三种种收收入入用用0、1、2代表代表(或用字母代表)或用字母代表)1.3 变量和数据变量和数据有了变量,何谓数据?有了变量,何谓数据?不不同同机机构构调调查查所所得得到到的的武武汉汉收收入入万万元元以以上上市市民民的的比例都不一样,这是变量比例都不一样,这是变量而而这这些些调调查查产产生生一一些些数数目目,这这些些数数目目就就是是数数据据(data)数据是关于变量的观测值。数据是关于变量的观测值。1.3 变量和数据变量和数据通过数据可验证有关的理论或假定。通过数据可验证有关的理论或假定。比比如如通通过过抽抽样样调调查查验验证证美美国国选选民民对对共共和和党党候候选选人人的支持率是否超过的支持率是否超过50%通过抽样,可以检验某批产品是否合格等等通过抽样,可以检验某批产品是否合格等等1.4 变量之间的关系变量之间的关系现实世界紧密联系的现实世界紧密联系的人人们们想想知知道道投投资资方方式式和和经经济济效效益益之之间间的的关关系系、旅旅客人数和经济发展之间的关系等等客人数和经济发展之间的关系等等不不讨讨论论变变量量之之间间的的关关系系,就就无无从从谈谈起起任任何何有有深深度度的应用,统计的基本概念就仅仅是摆设而已。的应用,统计的基本概念就仅仅是摆设而已。1.4.1 定量变量间的关系定量变量间的关系例例1.1广广告告投投入入和和销销售售之之间间的的关关系系。下下表表(数数据据ads.txt)显显示示了了某某企企业业的的广广告告投投入入和和销销售售额额之之间的关系(万元)。间的关系(万元)。横坐标代表广告投入,而横坐标代表广告投入,而纵坐标代表销售收入。纵坐标代表销售收入。看得出有何种关系吗?看得出有何种关系吗?1.4.1 定量变量间的关系定量变量间的关系能否从该数据回答下面问题:能否从该数据回答下面问题:这两个变量是否有关系?这两个变量是否有关系?如果有,它们的关系是否显著?如果有,它们的关系是否显著?这些关系是什么关系,能否用数学模型来描述?这些关系是什么关系,能否用数学模型来描述?这个关系是否带有普遍性?这个关系是否带有普遍性?这个关系是不是因果关系?这个关系是不是因果关系?1.4.1 定量变量间的关系定量变量间的关系关于因果关系关于因果关系在可控制的试验中,较容易找到因果关系;比如在可控制的试验中,较容易找到因果关系;比如治疗方式和疗效的关系等治疗方式和疗效的关系等但是,一般来说,变量之间有关系这个事实并不但是,一般来说,变量之间有关系这个事实并不意味着一定存在明确的因果关系。意味着一定存在明确的因果关系。1.4.1 定量变量间的关系定量变量间的关系比如,北京比如,北京GDP在一年中是快速增长的,而一个在一年中是快速增长的,而一个刚出生的武汉婴儿在这一年中的体重也是快速增刚出生的武汉婴儿在这一年中的体重也是快速增长的长的如果画出图来,它们有类似线性的关系如果画出图来,它们有类似线性的关系但它们显然没有因果关系但它们显然没有因果关系1.4.1 定量变量间的关系定量变量间的关系只要有关系,即使不是因果关系也不妨碍人们利只要有关系,即使不是因果关系也不妨碍人们利用这种关系来进行推断。用这种关系来进行推断。比如利用公鸡打鸣来预报太阳升起;虽然公鸡打比如利用公鸡打鸣来预报太阳升起;虽然公鸡打鸣绝对不是日出的原因鸣绝对不是日出的原因(虽然打鸣发生在先)虽然打鸣发生在先)1.4.1 定量变量间的关系定量变量间的关系简简单单的的办办法法(诸诸如如画画图图)可可以以得得到到一一些些信信息息,但但不一定能够给出满意的答案不一定能够给出满意的答案需需要要更更多多的的工工具具和和手手段段来来进进行行数数值值分分析析得得到到更更加加严格和精确的解答严格和精确的解答因此,需要继续我们的课程因此,需要继续我们的课程1.4.2 定性变量间的关系定性变量间的关系例例1.2下下面面是是对对123人人进进行行关关于于某某项项政政策策调调查查所所得得结结果果的的一一个个简简单单的的三三维维表表,它它显显示示了了人人们们的的收收入和性别对该项政策的观点入和性别对该项政策的观点.计算机软件所应用的数据形式计算机软件所应用的数据形式1.4.2 定性变量间的关系定性变量间的关系从从这这个个数数据据,希希望望可可以以看看出出收收入入、性性别别对对观观点点是否有影响及如何影响是否有影响及如何影响如如果果要要得得到到更更加加精精确确的的结结论论,就就要要进进行行进进一一步步的分析和计算的分析和计算这这是是后后面面列列联联表表分分析析或或多多项项分分布布对对数数线线性性模模型型的内容的内容1.4.3 定性和定量变量间的混和关系定性和定量变量间的混和关系有些数据不是仅有定性变量或仅有定量变量有些数据不是仅有定性变量或仅有定量变量需要知道包括定性和定量两种变量的一些变量之需要知道包括定性和定量两种变量的一些变量之间的关系间的关系下面数据就包含两种变量下面数据就包含两种变量1.4.3 定性和定量变量间的混和关系定性和定量变量间的混和关系该该数数据据有有2个个定定性性变变量量(性性别别,污污染染程程度度)、一一个定量变量(年龄)以及发生哮喘的人数个定量变量(年龄)以及发生哮喘的人数我们希望知道哮喘和这三个变量之间的关系我们希望知道哮喘和这三个变量之间的关系这将在这将在Poisson对数线性模型中讨论对数线性模型中讨论1.5 统计、计算机与统计软件统计、计算机与统计软件现代生活越来越离不开计算机了现代生活越来越离不开计算机了最初的计算机仅仅是为科学计算而设计和建造的。最初的计算机仅仅是为科学计算而设计和建造的。统统计计是是大大型型计计算算机机的的最最早早用用户户,现现在在仍仍然然是是数数值值计算的主要用户计算的主要用户1.5 统计、计算机与统计软件统计、计算机与统计软件计计算算机机的的使使用用,从从计计算算机机语语言言到到“傻傻瓜瓜式式”地地点击鼠标点击鼠标输输出出结结果果也也从从数数字字输输出出到到各各种种可可以以想想象象得得到到的的形式。形式。输输入入数数据据,点点鼠鼠标标做做一一些些选选项项,就就可可得得到到漂漂亮亮结果结果但其中充满了危险的陷阱但其中充满了危险的陷阱1.5 统计、计算机与统计软件统计、计算机与统计软件计算机无法识别你的统计方面的错误计算机无法识别你的统计方面的错误错错误误的的方方法法、错错误误的的数数据据形形式式都都必必然然输输出出错错误误的的结结果果(虽虽然然看看上上去去可可能能很很漂漂亮亮),得得到到大量垃圾大量垃圾另另外外,统统计计软软件件输输出出的的结结果果太太多多、很很难难都都理理解解1.5 统计、计算机与统计软件统计、计算机与统计软件统计软件的种类很多。我们仅介绍最常见的几种。统计软件的种类很多。我们仅介绍最常见的几种。只要学会使用一种只要学会使用一种“傻瓜式傻瓜式”软件或编程软件,软件或编程软件,使用其他类似的软件也不会困难;最多看看帮助使用其他类似的软件也不会困难;最多看看帮助和说明即可。和说明即可。学习软件的最好方式是需要时在使用中学。学习软件的最好方式是需要时在使用中学。统计软件统计软件SPSS:这这是是一一个个很很受受欢欢迎迎的的统统计计软软件件;它它容容易易操操作作,输输出出漂漂亮亮,功能齐全。对于非统计工作者是很好的选择。功能齐全。对于非统计工作者是很好的选择。Excel:它它严严格格说说来来并并不不是是统统计计软软件件,但但作作为为数数据据表表格格软软件件,必必然然有有一一定定统统计计计计算算功功能能。而而且且凡凡是是有有Microsoft Office的的计计算算机机,基基本本上上都都装装有有Excel。但但要要注注意意,有有时时在在装装Office时时没没有有装装数数据据分分析析的的功功能能,那那就就必必须须装装了了才才行行。当当然然,画画图图功功能能是是都都具具备备的的。对对于于简简单单分分析析,Excel还还算算方方便便,但但随随着着问问题题的的深深入入,Excel就就不不那那么么“傻傻瓜瓜”,需需要要使使用用函函数数,甚甚至至根根本本没没有有相相应应的的方方法法了了。多多数专门一些的统计推断问题还需要其他专门的统计软件来处理。数专门一些的统计推断问题还需要其他专门的统计软件来处理。SAS:这这是是功功能能非非常常齐齐全全的的软软件件;尽尽管管价价格格不不菲菲,许许多多公公司司还还是是因因为为其其功功能能众众多多和和某某些些美美国国政政府府机机构构认认可可而而使使用用。尽尽管管现现在在已已经经尽尽量量“傻傻瓜瓜化化”,仍仍然然需需要要一一定定的的训训练练才才可可以以进进入入。对对于于基基本本统统计课程则不那么方便。计课程则不那么方便。统计软件统计软件S-plus:这这是是统统计计学学家家喜喜爱爱的的软软件件。不不仅仅由由于于其其功功能能齐齐全全,而而且且由由于于其其强强大大的的编编程程功功能能,使使得得研研究究人人员员可可以以编编制制自自己己的的程程序序来来实实现现自自己己的的理理论论和和方方法法。它它也也在在进进行行“傻瓜化傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。以争取顾客。但仍然以编程方便为顾客所青睐。R软软件件:这这是是一一个个免免费费的的,由由志志愿愿者者管管理理的的软软件件。其其编编程程语语言言与与S-plus所所基基于于的的S语语言言一一样样,很很方方便便。还还有有不不断断加加入入的的各各个个方方向向统统计计学学家家编编写写的的统统计计软软件件包包。同同时时从从网网上上可可以以不不断断更更新新和和增增加加有有关关的的软软件件包包和和程程序序。这这是是发发展展最最快快的的软软件件,受受到到世世界界上上统统计计师师生生的的欢欢迎迎。是是用用户户量量增增加加最最快快的的统统计计软软件件。对对于于一一般般非非统统计计工工作作者者来来说说,主主要问题是它没有要问题是它没有“傻瓜化傻瓜化”。
展开阅读全文