资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,小组讨论主题,导言,“作为一种认识社会现象的活动,社会研究必然会涉及对社会现象进行测量的问题。”,风笑天,“操作化、操作化和测量之间的相互关联,使得研究能够围绕研究主题,发展出一套在实际世界中有效的、定义明确的测量。”,艾尔,巴比,学习目标:,掌握社会现象的测量方法、概念的操作化方法、量表的制作方法,培养操作化技巧与社会现象测量能力,为问卷设计准备。,什么是测量?,人们用自身的器官测量外部世界,眼睛,物体的大小、颜色、形状、距离,耳朵,各种声音的类型、高低、方向,鼻子,气体的味道,皮肤,环境的温度、湿度、有无物体,测量能力有限,测量结果不够精准,科学研究中,发明测量仪器,规定测量程序和规则,创造规范的测量方法,提高测量的方法与水平,什么是测量?,在社会研究中,也要进行测量:,人口登记,国家的人口数量和人口结构,电话访问,人口对不同政党的支持率,自填问卷,大学生所具有的择业倾向、社区服务的满意度,眼睛、耳朵,人的态度和行为,虽然各种测量的内容、方式千差万别,但是测量所具有的科学内涵是一致的。,测量的概念,测量,(measurement),:对所确定的研究内容或调查指标进行有效的观测与量度,即根据一定法则,将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程。,作用,:,将抽象的概念或命题转化为具体的可以观测和度量的问题或指标,通过对这些具体指标的分析建构社会科学研究的理论模型,测量的要素,测量谁?,测量客体,测量什么?,测量内容,怎么测量?,测量法则,如何表示?,数字与符号,测量客体,测量客体,即测量的对象、,研究对象,客观世界存在的事物或现象,桌子的高度,桌子,一杯水的温度,这杯水,社会研究中,各种各样的人,以及由若干个体组成的各种社会群体,社会组织、社区等,一个人的社会背景(性别、年龄、文化程度),我国,80,后对独生子女政策的看法,高中教师的教学质量评估,测量内容,测量的内容,:测量客体的某种特征或属性。,桌子的高度、颜色、重量,一杯水的温度、颜色、密度,社会研究中,个人、群体、组织、社区社会产品是测量客体,测量内容是他们的各种,特征,个人:行为、态度、社会背景,群体、组织:规模、结构、管理模式,社区:范围、人际关系、人口密度,测量法则,测量法则,:即用数字和符号表达事物各种属性或特征的操作规则。,测量桌子高度的测量法则是:,“,将桌子放置在水面的地面上,然后用直尺从地面垂直地靠近桌面的边缘,桌面所对就的直尺上的刻度即是桌子的高度。”,在社会调查中,人们的收入的测量法则可以是:,“将被调查者工资单上的实发金额加上每月奖金发放统计表上他所得的奖金数额就是被调查者的月收入。”,数字与符号,数字和符号:,即用来表示测量结果的工具。,在自然科学中:,120,厘米,测量桌子的高度,。用数字表示,黄色,测量桌子的颜色,。用符号表示,在社会研究中:,数字表示:被访者的年龄、收入、上下班时间、家庭人口数量,符号表示:被访者性别、婚姻状况,许多文字和符号表示的测量结果在统计时都转化为数字,但这些数字仍然是符号,不能进行数学运算。,性别:,1=,男,,0=,女,社会测量的特点,社会测量的复杂性,人的主观性,幸福感,测量者与测量对象的相互影响,访谈员与被访者,测量的不可重复性,自然科学中,测量对象相对稳定,可重复性强、量化程度高。,长度:厘米、分米、米;重量:克、千克,社会研究,测量对象复杂,量化程度低。,社会宽容度、教育成就,测量尺度,(,Levels of Measurement,),社会现象具有不同的性质和特征,对它们的测量就具有不同的层次和标准(分类),史蒂文斯,,1951,年,创立的测量层次分类法:,定类测量,定序测量,定距测量,定比测量,定类测量,定类测量,(类别测量或定名测量),(nominal measurement),:本质是一种分类体系。即将研究对象的不同属性或特征加以区分,标以不同名称或符号,确定其类别。,数学特征,:“,、,”,比如:,性别:男、女,婚姻状况:未婚、已婚、离异。,宗教信仰:基督教、天主教、穆斯林、佛教,分类既要穷尽又要互斥,测量层次最低,其它层级都包括分类功能。,定序测量,定序测量,(等级测量或顺序测量),(O,rdinal,measurement),:按照某种逻辑顺序将研究对象排列出高低大小,确定其等级及次序。,数学特征:“,、,”,比如:,文化程度:文盲、半文盲、小学、初中、高中、大专、大学及以上,城市规模:特大城市、大城市、中等城市、小城市,宗教信仰:基督教、天主教、穆斯林、佛教,比定类测量高一个层次,可分类,可排序,在统计时,将高低、强弱、大小不同的序列转换为数字,但其仍为符号,无数字实际内涵。,定距测量,定序测量,(等距测量或区间测量),(I,nterval,measurement),:不仅能将社会现象或事物区分为不同的类别、不同的等级,而且可以确定它们相互的间隔距离和数量差别。,数学特征,:“,、,”,比如:,温度:广州,32,,兰州,12,,则,32 12,,,32,12,,,32-12=20,,广州比兰州热,20,智商:张三,125,,李四,110,,则张三的智商比李四高,15,可分类,可排序,可算距离(用减法),无“绝对零点”,,不具有数字中“,0,”的含义,温度,定比测量,定比测量,(等比测量或比例测量),(R,atio,measurement),:除具有上述三种测量的全部性质之外,具有一个有实际意义的绝对的零点,其数据可以加减或乘除运算。,数学特征,:“,、,、,”,比如:收入、年龄、出生率、性别比,收入:张三收入,480,,李四收入,240,,则张三的收入是李四收入的两倍,测量层次的数字特性总结,定类测量,定序测量,定距测量,定比测量,类别区分(,=,、,=,),次序区分(、),距离区分(,+,、,-,),比例区分(,、,),测量层次的小结,高层次测量具有低层次测量的功能,高层次测量可以降低为低层次测量处理,反之则不行,测量层次不同,统计上数据分析方法不同,社会测量中的,重要规则,:尽可能进行高层次测量,本节要点,概念、变量与指标,概念化的含义与作用,操作化的方法,指标选择的多样性,第二节 概念的操作化,操作化相关的概念:,概念、变量、指标,概念,,是对社会现象的抽象,它是一类事物的属性在人们主观上的反映。,变量,,是指具有一个以上取值的概念。,变量的特征,穷尽性(每一个被调查者的情况都应归于某个取值中),性别,男、女,职业,工人、农民、军人、其他,互斥性(每一个被调查者的情况仅属于一个取值),收入,1000,元以下、,1000-2000,元、,2000-3000,元、,3000-4000,元、,4000,元以上,收入,1000,元以下、,1000-3000,元、,2000-4000,元、,4000,元以上,构念(,construct,):作为结构的概念,科学家测量的三类事物,可直接观察的事物,苹果的颜色、试卷上的答案,间接观察到的实物,试卷上的男女标记、公司会议记录提供了过去的社会行为,建构的事物(,construct,),是理论的产物、来源于观察,却不能被直接或间接地观察,智商,IQ,概念的建构来自于思维的想象(观念)上的共识,操作化相关的概念:,概念、变量、指标,指标,(,Indicator,),指表示一个变量含义的一组可观察到的事物。它是具体的、客观存在的、可观测的。,“考试难度”测量:难度,=1-,平均分,100,“贫富差距”测量:基尼系数。,操作化相关的概念:,概念、变量、指标,概念、变量、指标的关系:,可,选,指,标,指标,1,(指标,3,),(指标,2,),常量,变量,概念,可,选,指,标,操作化相关的概念:,概念、变量、指标,概念、变量、指标的关系:,“教师教学效果”(概念),可转化为三个方面(维度):,教学态度、教学方法、教学效果,每个维度有若干指标,:,教学态度(备课认真程度、尊重学生,);,教学方法(内容、课堂气氛、现代教学手段,);,教学效果(学生听课后学习收获的大小,学习兴趣是否有提高,),操作化的含义与作用,社会研究中所要测量的许多变量都是十分抽象的概念。要使这些概念能够被我们所测量,必须对它们进行操作化处理。,“,操作化,”,既是社会研究中常用的概念,同时,它也是社会研究过程中最为困难、最为关键的步骤之一。,对概念进行操作化处理,就是要给出概念的,操作定义,,,就是建立一些具体的程序或指标来说明如何测量一个概念。这种定义即一套程序化的工具,它告诉研究者如何辨识抽象概念所指称的现实世界的现象。,公平感、满意度,小康水平,小康,的变量与指标,人均,国内生产总值,2500,元,(,按,1980,年的价格和汇率计算,,2500,元相当于,900,美元,),;,城镇,人均可支配收入,2400,元,;,农民,人均纯收入,1200,元,;,城镇,住房人均使用面积,12,平方米,;,农村,钢木结构住房人均使用面积,15,平方米,;,人均,蛋白质日摄入量,75,克,;,城市,每人拥有铺路面积,8,平方米,;,农村,通公路行政村比重,85%,;,恩,格尔系数,50%,;,成人,识字率,85%,;,人均,预期寿命,70,岁,;,婴儿死亡率,3.1%,;,教育,娱乐支出比重,11%,;,电视机,普及率,100%,;,森林覆盖率,15%,;,农村,初级卫生保健基本合格县比重,100%,。,社会指标体系,操作化的含义与作用,操作化的作用,对同一概念或命题有同一的理解,使概念或命题具体化,使概念或命题量化,操作化的方法,概念,:将抽象的概念转化成可观察的具体指标的过程。,方法,:,“父母投资”,界定概念(理论概念、操作性概念),父母为子女提供帮助,列出概念的维度,发展指标,早期家庭帮助,近期的帮助,正在给予的帮助,照看子女,做家务,给予经济上的帮助,界定概念,想一想:,将,“,越轨行为,”,操作化为一组指标。,(,misbehavior),违法行为,违纪行为,违警行为,犯罪行为,违德行为,违俗行为,越轨行为,夜不归寝、酗酒,早退、旷课,打架、迟到,违规使用电器(大功率、高音响),越轨行为,本节要点,指数与量表的概念,李克特量表,语义差异量表,第三节 指数与量表,测量工具,对概念的复合测量可以有两种主要的方式:,指数,量表,指数,概念,由多个不同的回答所构成的一个简单累加的分数,失业率,=,失业人数,/,(就业人数,+,失业人数),100%,人口密度,=,人口数,/,总面积,量表,(,Scales,),含义,量表是一种用于测量人们的态度、看法、意见、性格等主观性较强的内容的工具。,社会调查中常用的量表类型,总加量表(,Summated Rating Scales,),李克特量表,累积量表,语义差异量表,总加量表(,Summated Rating Scales,),它是由一组反映人们对事物的态度或看法的陈述构成的,回答者分别对这些陈述发表意见,根据回答者同意或不同意的程度分别给予不同的分数,然后将回答者在全部陈述上的得分加起来,就得到了该回答者对这一事物现象的态度得分。,总加量表(,Summated Rating Scales,),贝利生育量表(部分),提问项目,同意,不同意,1.,结婚的主要原因之一是要孩子。,1,0,2.,只生一个孩子是错误的,因为独生子女在孤独中成长,且会因无兄弟姐妹而忧郁。,1,0,3.,生育孩子是一个妇女所能具有的最深刻的经历之一。,1,0,4.,两种性别的孩子至少都有一个比仅有一种性别的孩子好。,1,0,总加量表(,Summated Rating Scales,),总加量表的特点,每一个态度称述都具有同等的效果,不同的陈述之间不存在数量的差别,分值都一样,表中每一个陈述所表达的态度方向与计分的方向应保持一致,李克特量表,李可特量表是目前使用最广泛的总加量表,它是由美国社会心理学家李可特于,1932,年在原有的总加量表基础上改进而成的。,李可特量表由一组陈述组成的,每一陈述有“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”五种回答,分别记为,1,,,2,,,3,,,4,,,5,,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。,项目,非常同意,同意,无所谓,不同意,很不同意,看法(,1,):婚事应尽量办得简单些。,看法,(2):,结婚是人生大事应办得隆重,热闹,花再多钱也值得。,看法(,3,):就是有钱,婚事也不应大操大办。,非常同意,同意,无所谓,不同意,很不同意,看法(,1,),1,2,3,4,5,看法(,2,),5,4,3,2,1,看法(,3,),1,2,3,4,5,李克特量表,李克特量表的制作,李可特量表的制作程序是:,根据所要测量的内容或变量收集大量与这一内容有关的问题,然后初步筛选出一组问题(在社会调查中,一般为,10-30,个)作为量表草案;,确定问题的类别和计分标准;,预调查;,统计每位受测者在每条陈述上的得分以及每人在全部陈述上的总分;,计算每一条陈述的分辨力,删除分辨力不高的陈述,保留分辨力高的陈述,形成正式的量表。(分辨力系数的计算),李克特量表的特点,容易设计;,它的适用范围比其他量表要广,它可以用来测量其他一些量表所不能测量的某些多维度的复杂概念或态度;,通常情况下,李可特量表比同样长度的量表具有更高的信度。,李可特量表的五种答案形式使回答者能够很方便地标出自己的位置,相同态度得分者具有十分不同的态度形态,。,鲍格达斯社会距离量表(,Bogardus social distance scale,),是一种定量的测量人们相互间交往的程度、相互关系的程度或者对某一群体所持的态度及所保持的距离的工具。,鲍格达斯社会距离量表(,Bogardus social distance scale,),愿意,不愿意,提问项目,1.,你愿意让黑人生活在你的国家吗?,2.,你愿意让黑人生活在你所在的城市吗?,3.,你愿意让黑人住在你们那条街吗?,4.,你愿意让黑人做你的邻居吗?,5.,你愿意与黑人交朋友吗?,6.,你愿意让你的子女和黑人结婚吗?,语义差异量表也称为语义分化量表,是用一组意义相反的陈述或形容词构成一份评价量表,以用来测量人们对某一特定概念或事物的不同意识或感受。,量表的记分:其记分方法有两种,一种是将两陈述或两形容词间的七小段横线从一端到另一端分别记,1,到,7,分;另一种则是分别记为,-3,,,-2,,,-1,,,0,,,+1,,,+2,,,+3,分。要特别注意的是,每一对陈述的记分方向要依据整个量表的方向来决定。,语义差异量表,量表的计算方法,通过计算各个不同的群体在每一个单纯的陈述中的平均分。,先将表格中的陈述对按所测的维度分成若干个小组,然后再按上法计算出各群体在这些小组的总平均分,并比较他们之间的差别,将对于不同评价的对象或概念在各陈述对上的评分进行比较。,语义差异量表,50,语义差异量表的特点,表中的形容词包括三个一般的维度,评价(好与坏、善与恶)、力量(强与弱、刚与柔)、行动(主动与被动、快与慢),这种方法具有很高的再测信度和表面效度,本节要点,信度,效度,信度与效度的关系,第四节 测量质量的评估,观测值的分解:,测量理论的基础是数理统计中的误差理论或变异理论。,测量理论建立在“任何观测值(测量分数或测量结果)都有误差”这一假设之上。,它认为,,观测值(,X,)是有四个部分组成的,:,真实值,T,。,其他变量的影响值,O,。,系统偏差,B,。,随机误差,E,。,测量分数:,X=T+O+B+E,测量的信度与效度,信度(,Reliability,),概念:即可靠性,是指测量结果的一致性或稳定性,即测量工具能否稳定地测量所测的事物或变量。也即采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。常用相关系数,r,来表示信度。,如:一个人站在测量体重的磅秤上,前后几次称出几个明显不同的重量,那么磅秤本身必定有问题,说明这架磅秤是不可靠的。,测量的信度有问题!,信度系数是同一样本所得到的两组资料的相关系数。,当,r,0.90,时,可以认为实得分数中有,90%,的差异来自测量对象本身的差异,只有,10%,来自测量误差。当,r0.80,,即可以认为测量是达到了足够的信度。,测量的信度,信度的类型,再测信度,(,Test-retest Reliability,),是指采用同一种测量对同一对象在不同的时间点先后测量两次,根据两次测量的结果计算出相关系数,这种相关系数,r,就叫做再测信度。缺点:易受时间因素的影响。,如:两次测量身高。,复本信度,(,Parallel-forms Reliability,),如果一套测量有两个以上的复本,则可根据同一对象同时接受这两个复本测量所得的分数来计算其相关系数,这种相关系数,r,就叫做复本信度。,如:期末考试的,A,、,B,卷。,测量的信度,信度的类型,折半信度,(,Split-half Reliability,),即将研究对象在一次测量中所得的结果,按测量项目的单双号分为两组,计算这两组分数之间的相关系数,这种相关系数就叫做折半信度。,如:测量项目按单双分为两部分。,测量的效度,(,Validity,),概念:也称测量的有效度或准确度。它是指测量工具或测量手段能够准确地测出所要测量的变量或事物的程度。也即能够准确、真实、客观地度量事物属性的程度,。,测量的效度,(,Validity,),效度的具体类型,表面效度(,Face validity,),是指测量内容或指标与测量目标之间的适合性和逻辑相符性。也即是指测量所选择的项目是否“看起来”符合测量的目标和要求。,目标,桌子的形状,测量四边长度、邻边夹角,目标,城市邻里关系,测量邻里联系频率、对邻里情况熟悉程度,准则效度,(,Criterion Validity,),是指用一种不同以往的测量方式或指标对同一事物或变量进行测量时,将以往原有的某一种测量方式或指标作为准则,用新的方式或指标所得到的测量结果与原有准则的测量结果作比较,如果新的测量方式或指标与原有的作为准则的测量方式或指标具有相同的效果,那么就可以认为这种新的测量方式具有准则效度。,2009,年进行的某次调查中涉及如下两个问题,Q4,:您的年龄是,36,岁。,Q27,:您在,1999,年结婚,当时,26,岁。,测量的效度,(,Validity,),建构效度(,Construct Validity,),是指通过将测量结果与有关理论命题或假设进行对比来考察测量的效度。,如:理论假设,婚姻满意度与主动做家务的行为有关。婚姻满意度越高,越是主动承担家务。,将婚姻满意度的测量指标换成新指标以后,测量结果,婚姻满意度越高,越是主动承担家务。,具有建构效度,婚姻满意度不同,承担家务的行为相似。,不具有建构效度,测量的效度,(,Validity,),测量的信度与效度的关系,测量的信度与效度之间既有明显的区别,又存在着某种既相互联系,相互制约的关系。信度主要回答调查结果得一致性、稳定性和可靠性问题;效度主要回答调查结果的有效性和正确性问题。信度和效度之间的关系有四种类型:,可信且有效。,可信但无效。如调查某地粮食产量,但设计的统计指标是播种面积,投入粮食作物生产的劳力、资金等,即使数据可信,对说明当地粮食产量来说,其效度仍然很低。,不可信但有效。这种情况在理论上应该是不存在的。,不可信亦无效。这是测量中应避免的类型。,信度和效度的上述四种关系,见下图:,测量的信度与效度的关系,总之,信度是效度的基础,是效度的必要条件而非充分条件(一般来说,缺乏信度的测量肯定也是无效度的测量;但高信度的测量未必同时也是高效度的测量,即它也许是有效度的,也许仍然是无效度的),;,效度则是信度的目的和归属,没有效度的信度就失去了其本来的意义。任何社会测量,只有做到信度和效度的统一,才是可信且有效的。,小结:掌握测量的四个层次;总加量表,李克特量表;操作化的方法。,实作:,对你的调查课题中的核心概念进行操作化。分小组工作共同完成,并由小组代表在课堂上作汇报。,
展开阅读全文