1、内容分析法与编码表的实施过程(一)内容分析法与编码表的实施过程社会研究方法中的一个重要的研究方法是内容分析法。作为非介入性的研究方法,内容分析法是对被记载下来的人类传播媒介的研究。其内容可以包括书籍、杂志、网页、诗歌、报纸、歌曲、绘画、讲演、信件、电子邮件、网络上的布告、法律条文和宪章以及其他任何类似的成分或集合。 1 Kimberley Neuendorf认为内容分析法是一种用科学方法对讯息进行归纳的定量研究方法该方法不局限于要测量的变量类型或者是创造,陈述讯息的背景。2通过这一客观的、系统的、量化的对传播所显示出来的内容进行研究的方法可以对被记载下来的传播媒介进行研究、整理。从本质上来说,
2、内容分析法是一种编码,而编码是将原始材料转化成标准化材料的一种形式。 3编码:“内容分析法在本质上是一种编码。编码是将原始材料转换成标准化形式材料的过程。”4內容分析与编码(coding)可以交换使用,指以客观的、系统的,以及量化的描述任何有意义的行为。编码的应用主要是为了让电脑发挥其魔力。那首先就要让电脑读懂我们所搜集的资料,这就需要对资料进行数字化的处理。例如美国总统说现在美国面临的最大问题是走出经济危机的阴影,电脑当然不会理解这样的问题,我们必须将它转化,这就是编码。但是,中国目前关于内容分析法的文献资料大多还是援引或者借鉴了国外的一些前沿理论,根据对CNKI有关中国学术期刊对内容分析法
3、的相关资料的搜集,我们可以发现,把内容分析法作为一个专门的学术论文进行研究的作品非常少,大多的国内学者都是以内容分析法作为自己研究的一门工具,如这样一些作品基于内容分析法的中国新闻奖与普利策新闻奖的比较研究、隐秘的偏向纽约时报美总统大选报道分析、旅游者摄影心理初探基于旅游照片的内容分析。就目前来说,对于某些议题,内容分析法比其它任何调查方法都要适用,尤其在传播媒介研究方面。内容分析法回答了传播学中的一个经典的问题:“谁说了什么、对谁说、为什么说、如何说以及产生了什么影响?”Kimberley Neuendorf认为内容分析法的作用有四点:描述,推理,测量和预测。5不管中国学界的研究如何,通过文
4、献综述,我们可以发现,相较于其他的研究方法,内容分析法有自己的特有优势,包括经济,节省人力、物力;安全与非介入性,不需要涉入到实地调查当中,非接触、可反复进行;研究范围广泛,可以超越时空限制可以研究一长段时间里的事情和能够研究一长段时间内发生的事件。不可避免的缺点在于其局限于已经记录下来的内容,编码困难,并且还有信度和效度的问题。本文的研究主题是内容分析法和编码表的实施过程,作为观察法的一个模式,内容分析法要求仔细地处理要关心的内容,而该模式中对所得资料的分析和其他模式一样,特别强调为什么以及产生什么影响。内容分析法的应用过程可以分为确定研究问题或假设,确定总体,抽样,选择分析单位,建构类目系
5、统与量化系统,制作编码表,培训编码员,对资料进行编码,录入计算机和进行统计分析,报告研究结果等十步。下面,我们以编码为重点,分别讲述每一个步骤。(一)确定研究问题或假设研究者要将内容分析的目的要清楚的表达出来,避免为了统计而统计,导致无目的的数据收集。确定研究问题或假设,不仅能便于分析内容,还可以获得更具价值的数据。例如研究者统计New York times和Esquire 标点符号的使用,你也许会得出这样的结论:同New York times相比,Esquire的逗号的使用率和分号的使用率分别高出45%和低出23%。对大众传媒理论的理论政策制定而言,这种结论的有用性值得怀疑。研究工作者陈述分
6、析目的时,要以主题需要为指导。分析研究内容之前必须要针对实际需求, 有严密周到的思索与判断,增益思维,形成假设或研究问题。研究问题可以来自于情报的分析或者是工作的需要, 也可以从已有的理论、原先的类似研究结果或实际问题中提出。 6下面我们再看一些值得肯定的研究问题或者假设:人们日益接受赛车是否会影响电视节目中所描绘的赛车手的形象;集体所有制电视台的公共事务节目编排是否会有别于其他类型的电视台; 7再例如,研究者假设不断发展的妇女运动在媒介内容里应该有所体现,于是提出一个研究问题:20世纪90年代以来,我国妇女运动的发展是否带来了新闻中女性形象的变化?研究者需要通过文献综述来总结“社会真实”,即
7、过去十年我国妇女运动的基本脉络,重点议题和进展特点,然后再描述新闻中女性形象的变化及其趋势,将二者对比,如果相关,就说明妇女运动的确影响了新闻,如果不相干,那么就可以接着讨论不相关的原因。 8(二)确定总体抽样的前提是确定研究总体,包括所研究的主题和时间跨度,这往往直接从研究问题中就能推导出来。比如,研究总体是“我国女性新闻”,我们就必需解释什么是女性新闻。研究者浏览了许多关于女性新闻的研究文献之后,发现至少有三种“女性新闻”定义:(1)女性在其中出现的新闻。(2)关于女性议题的新闻。(3)站在女性立场进行报道的新闻。除此之外,我国有几份报纸的英文名字里包含“women”和“news”,比如中
8、国妇女报和女报,那么这些报纸上的新闻算不算“女性新闻”呢?为了避免文献资料少的问题,研究者决定同时采用这四个定义。时间跨度“20世纪90年代以来”,这样的定义也不够准确,有些模糊,更明确的表达应该具体到年份,考虑到当时所处的研究年代,研究者决定将时间跨度定为“19902002年”。 9例如如果我们要分析流行歌曲的内容,我们就必须说明什么是流行歌曲。是排名前十位的歌曲还是前十五位的歌曲是流行歌曲?是否只要在专业流行歌曲杂志上刊登的歌曲都属于流行歌曲。10在曹琴仙和于淼基于内容分析法的专利文献应用研究一文中,作者是这样定义他的研究总体的主题的:广义上讲, 专利文献是指在实行专利制度的国家和地区,
9、在接受申请和审批过程中所产生的官方文件和相关出版物的总称, 具体包括发明专利申请说明书、实用新型专利申请说明书、各种检索工具书和专利审批程序中产生的文件(如专利证书等) 。狭义上讲, 专利文献指专利申请说明书, 包括公开说明书、公告说明书和专利说明书。我国同时以纸质、缩微胶片、光盘等多种载体向国内外发行中国专利公报、中国专利说明书等多种专利文献。11在基于内容分析法对网络行为研究现状的分析中,作者写道“网络行为是一个广义的概念,它研究的是不同的用户在网络上表现的活动方式,可以从两个层次来理解。第一个层次,为满足互联网用户的最基本的上网需求,也就是把互联网作为一个新的信息源,共享它的资料,满足网
10、络用户对信息的需求。第二个层次,向各个专项、特殊应用的网络服务领域扩展。随着网络的普及,网民的增加,人们越来越重视网络行为的研究。本文所研究的网络行为属于研究不同的用户在网络上表现的不同的活动方式。”12现在,让我们再来看几个完整的总体表述:1.该研究是有关2004年9月1日至2004年8月31日纽约地区黄金时间的电视商业广告。2.该项研究有关去年1月1号到12月31日(周日除外),纽约时报和华盛顿邮报的头版报道内容。133.中国传媒大学的陈凯和孙江华同学的论文纽约时报的悄然变脸1990 - 1999 年纽约时报头版内容分析。14(三)抽样确定总体之后,我们可以分析所有相关内容进行普查,我们也
11、可以抽样进行分析。所有抽样方法同样适用于内容分析。选取样本的标准:符合研究目的,信息量大,具有连续性,内容体例基本一致,简而言之,应能从样本的性质中推断与总体性质有关的结论。15大众传媒研究运用最广的抽样方法莫过于多阶段抽样。此外还有分层抽样等。内容分析的抽样往往是多级的。第一步,需要确定研究样本来自哪家媒体,第二步对研究日期进行抽样。第三步确定研究样本。根据纽伯德的观点,大众传媒研究的抽样方法有三步,一是确定研究样本来自哪种形式的媒体(如,报纸,杂志,广播,电视,电影)以及是哪种体裁(新闻,时事,戏剧,肥皂剧还是纪录片等等);二是对研究日期进行抽样;三是对与这些媒介相关的内容进行抽样。16下
12、面我们举几个例子:比如“我国妇女新闻”可能出现在任何一家中国媒体上,研究者要缩小范围,可以采用分层抽样的手段,将媒体按照类型(报纸,广播,电视,互联网)和地理分布(全国,省,市,县)两个指标进行分层,抽样出某些媒体来代表全国媒体;也可以采用立意抽样,研究者认为重要的全国性媒体比普通的省级或者市级媒体更能体现我国媒体在“女性新闻”上的变化,这样做更节省研究时间和经费。当研究问题以经具体指出了研究总体是某一特定某体或者节目时,比如对人民日报关于“万元户”报道内容的分析,对中国妇女报杂志封面人物的内容分析,对中央电视台新闻联播节目的内容分析等,这一步抽样可以省略。 17确定了研究样本来自哪家媒体之后
13、,研究者接下来对研究日期进行抽样。一个抽样版本日期选择办法:按照一个月的某个星期或者一周的某一天进行分层抽样,规则是只能选取某一周的一天或者两天,不能超过两天,以确保某月内抽样分布的平衡。另一个办法就是构建一个构造周:为样本中的每个月建构一个周。例如从一月当中的四,五个星期一中随机选取一个星期一,在从一个月中若干的星期二中随机选取一个星期二,如此往复,直到一个星期的七天都囊括在内。18比如一家周一至周六出版的报纸,每隔七天抽取一份,那么连续的六份样本报纸就可以囊括周一到周六这六天出版日期,于是形成一个构造周。有研究证实,一个构造周的媒介内容的均值,比任意连续一周或者随机抽样的均值,更接近全年总
14、体的均值。19那么我们应当选择多少抽样版本日期呢?一个原则是,发生率越低,抽样选择的日期越多。抽样日期的数目应当起到体现我们所要研究问题中的某个现象的发生率的功能。另一个适用于周刊和周报的原则是按月分层抽样,选择12期是最有效的抽样规模。其次是14期。总的说来随机抽样的规模越大,样本越具代表性。20.根据一些专业的内容分析人士,亚抽样的样本数目要保证可信度就不能少于50,同时也尽量不要超过300个。(诺因多夫)21下面我们再举例说明在内容分析中如何运用多阶段抽样。研究问题:从1980年到2000年,在男性杂志上刊登的广告商品种类是否有变化。抽样第一阶段:选取杂志发行数据显示80%或者80%以上
15、的读者为男性的杂志,我们称为男性杂志。这些男性杂志可以分为两组:大型杂志和中型杂志。大型杂志:男性读者人数达到或者超过100万中型杂志:男性读者人数在50万到99万999人之间。从这两组杂志中,每组随机抽取3本,共抽取6本。抽样第二阶段:选取期数每年按4个月分为一组,一年随机抽取3期。从1月,2月,3月,4月中抽取一期杂志,以此类推。每份杂志都按照此种方法进行,最后每本杂志抽取30期,共180期。22除了最常用的多阶段抽样之外,我们还会用到分层抽样,简单随机抽样和立意抽样等。例如研究者如果对美国报纸的社论观点有兴趣,可以进行随机抽样。假设社论观点因为地区不同,出版周期不同(比如周报和日报)而不
16、同,为了保证足够抽样样本中的每个地区的周报和日报的数量是足够的,我饿每年可以采取分层抽样。这里,我们可以将报纸的总体按地区和出版周期划分为若干子总体,再对子总体进行随机抽样。这样的抽样方式能保证最后的样本具有代表性。23例如在纽约时报的悄然变脸1990 - 1999 年纽约时报头版内容分析里,研究者以纽约时报的头版文章为分析内容, 时间跨度为1990 年至1999 年度, 样本量为40 。他们先把1990- 1999 年间的报纸按时间顺序排列, 然后采用简单随机抽样的方式, 每季度抽取一份样报, 以篇为单位对报纸内容进行分析。经过精心的设计, 形成了对这40 份报纸进行信息采集的编码表, 并计
17、划对数据采用国际通用的分析软件SPSS进行分析, 采用Excel 软件对分析的结果作图。24 抽样的最后阶段:选择研究样本同样。我们举例说明研究者如何确定研究样本。例子:研究问题:1955至1996年间,中国内地省际新闻之间的相互流通情况是什么? 1 本研究只关注新闻,因此那些表述意见的文章(如社论,评论,读者来信),副刊,广告,天气预报等非新闻内容被排除。2 省际新闻指的是发生在外省的新闻,无论本省人士是否参与。本省指的是报纸出版所在地,“外省”指的是“本省”以外的所有省份。3关于中央领导人的活动,无论活动地点在本省还是外省,都不记入样本内,否则,对于北京日报而言,无法判断大量中央领导人在北
18、京的活动是“本省”还是“外省”。25在抽样过程中,我们要注意一个问题: 内容本身系统性偏误。例如对某一日报的体育赛事报道的总量进行抽样,如果你选择四月,由于三个或者更多的职业比赛会同时在四月发生,这会导致一个放大的统计结果。26(四)选择分析单位分析单位在社会学研究中指的是描述和解释的个体单位,对分析单位的确定是进行抽样的基础。27作为社会研究的基本要素,对分析单位的选择与确定乃是研究设计的一项重要内容,分析单位是否合适、能否清晰地界定与使用,直接关系到研究结果的有效性,甚至在很大程度上决定了整个研究的成败。 28同时,分析单位不仅是内容分析里面最小的一个要素,而且还是最重要的一步。比如,要研
19、究一本书的意识形态倾向,确定的分析单位可以是一个词,一个符号,一个段落、整篇文章、整个故事。在对电视剧和电影的分析中,分析单位可以是角色、行为。 29又比如,要分析全球化程度,内容分析单位可能收集外国直接投资的统计数据、本国和海外公司的战略联盟的规模、方向和本质等,通过这些数字指标把“全球化”与特殊的结果尺度联系. 30再如,传播学术期刊一向被研究者认为是了解某一领域趋势的晴雨表, 能够反映传播媒介研究的演进发展。因此学者们通过研究杂志上的文章来考察大众传播研究内容趋势的做法非常普遍。在相应的领域哪些方法运用得最多, 哪些运用得较少哪些研究主题被经常涉及比和认为大众传播领域的学者和其他学者一样
20、总是对这些研究趋势抱有极大的兴趣, 而研究已发表的期刊则有助于回答这些问题.31在一项分析中,明确的分析单位可以使整个分析更简洁明了。当然,上述关于一篇文章、一本书、一部电影这样比较微观、静态的事物进行分析时,可能明确的分析单位的作用还不是很明显。以更为宏大的事物为例,我们可以看看分析单位的清晰界定对整个研究的作用究竟有多大。比如我们在对社会结构进行研究时,就有必要全面考察社会这一概念所包含的完整的分析单位。社会这一概念含有各种各样程度大小不同的分析单位, 有社区、党派、村落般的小规模社会分析单位, 有国家等等这样大型的社会分析单位。对于社会的研究,我们必须根据自己课题的需要进行明确的分析单位
21、的划分才能更精确地从事的研究. 32要找到明确的分析单位并且要对以后的研究者的查阅有所助益的话,就必须对分析单位进行彻底、全面和清晰的可操作定义。可操作定义应该涵盖的事物标准也应该是明白和容易观察的。要达到这个目标必须下一番功夫。在初始阶段,研究者必须有一个定义的粗略构想,并且选用一些样本代表来进行测试,以发现定义上的问题。这样一个过程常常会导致更深入的重新定义以及对操作定义的调整。 五)建构类目系统与量化系统任何内容分析的核心都是对课题内容进行分类。要对研究课题的整个系统进行精确的架构使得对内容进行分类会随着研究主题的不同而不同。准确的分类对内容分析来说是相当重要的。 33所谓类目,就是指内
22、容的分类。它是内容分析的基本单位,是将内容单位归类的标准。一般有两种方式来对内容进行分类。一是初始编码,初始编码是在对数据进行初步测试之后进行分类。这一分类系统是基于从数据本身呈现出来的普通事实和主题。比如,有学者在分析FM广播电台网站的内容时,测试了许多节目的频度以后,发现这些数据主要是集中在4个类别当中,广播站频率变量、广播站信息变量、新闻和信息以及其他方面。34另一种方法是在基于理论和概念的基础上,在数据收集好之前提前编码建立分类,学者kerr & Moy就在分类的基础上发展了一套10类的标准系统进行分类。而关于编码,根据艾尔比尔的观点,编码有两种基本方法。一种是根据研究需要,设计一种相
23、对容易的编码法案或是利用一些既有的研究方案。第二种是根据资料编码,即在研究中,研究者不知道研究主题代表哪些变量,最典型的例子是问卷调查。研究者不可能预测到所有的答案,所以只能根据答案进行编码。35也有学者将这两种定义为“先验编码”和“急诊编码”,即一种建立在对于数据做了初步的分析以后,一种则是建立在已有的理论之上。36例如:第一种:在基于理论和概念的基础上,在数据收集好之前就已建立分类。比如性别这种变量的分类固定为:男/女。 第二种:对数据进行初步测试之后,根据数据的特性进行分类。建构分类要注意的问题:李秉德、檀仁梅以及李方,杨小微共同提到了:为保证内容分析法研究结果的客观性,确定编码的依据(
24、也就是类目)时应注意几个问题。这几个问题分别是:类目的确定必须是在进行内容分析判断之前预先制定的,不能一边分析,一边适应性地修改补充。分类要详尽全面,应包括该研究课题所规定的内容的所有部分,不能出现有无处归放的分析单元。类目之间不能相互包含或重叠,含义明确。3738从实用角度来说,所有分类系统都必须相互独立,相互排斥并且要穷尽一切可能性还得可靠,具体来讲:内容分类的互斥是指一个分析单位能且只能被划分入一个类别。如果研究者发现一个分析单位可以同时被放进两个类别中,那么这样一些类别的定义就需要被修正。例如,如果我们打算研究美国大选民主党的主要支持者,并采用如下的一些分类系统来描述分类:1)非裔美国
25、人,2)犹太人,3)白人,4)土著美洲人,5)其他。很明显,犹太人会同时进入两个类别中,违背了互斥原则。 39再如,当我们想通过下列一些分类来描述中国电视的节目类型:1)情景喜剧2)儿童节目3)电影4)纪录片5)动作片或探险节目6)脱口秀或竞猜节目7)肥皂剧。初看第一眼也许会觉得这样的分类是合理的,但是诸如张以庆的幼儿园这样的作品,应该属于电影还是纪录片呢,很难得到清晰的分类。除了互斥,内容分析的分类还应该做到穷尽。应该存在这样一个分类,那就是可以使所有的分析单位都有处可放,如果研究者发现有的分析单位不适用于任何分类标准,那么既有的分类系统就是存在问题的。在大众媒介内容分析方面,要做到穷尽性并
26、不困难。如果发现了一两个比较特殊的例子,它们可以被归到“其他”这样的类别中。但是如果太多的条目都被划入这样的类别中就有必要对初始的分类进行重新考察了。另外一个保证穷尽的方法是采用二分法或三分法。二分法是指将一个事物分为两个方面40三分法是指将事物分为三个部分或方面。41所有内容,一般来说,我们对一个问题可以采用两个极端对立的分类法或者极端和中立的描述方式,如好、坏;攻击性的与非攻击性的;喜欢、不喜欢、中立等等。确定一个分类系统是否穷尽的实用方法就是将一些样本试用到整个分类系统中。如果出现了一些无法归类的条目,那么在分析之前这一原始的计划就需要得到修正。分类系统同样需要可靠。也就是说不同的编码者
27、需要对这些分类的绝大部分没有异议。这样的一致性尝尝在内容分析中得到quantified,被称作intercoder reliable。精确的分类定义一般来说可以增加可信性,whereas sloppily定义的分类会使之降低。建立一个量化体系在内容分析法中,四种变量都可以使用。这四种变量分别是定性变量、定序变量、定距变量以及定比变量。这四个变量是按照测量尺度进行的分类。定性变量是把变量的不同特征和属性加以区分,具有完备性和排他性。在这个层面上,研究者一般只是简单的统计每一个个体在其类别中所出现的频率。例如,有学者对音乐电视里的商业广告进行内容分析,发现只有6.5%的男性角色被认为为穿着比较性感
28、的衣服,没有男性角色被认为穿着非常性感;而相应的数据在女性角色中则分别为24%和69%。42定序变量是按照某种逻辑对变量进行排序,“不同的属性代表了变量的相对多寡程度”。 43例如受教育程度的高低等等。但是,在定序变量中,属性间的实际距离的测量没有意义,定序变量在内容分析法中并不常用。定距变量是在定序变量分等级的基础上,还可以确定不同水平之间的间隔距离和数量差别。例如,研究者用定距变量研究商业广告中的女性形象。每一个角色都可以用定距变量进行分析,从“依赖-独立”、“主导-顺从”。 44定比变量是在定距变量的基础上更进一步,就是有绝对的零点。“它是建立在真实基础上的。”45例如人的收入。在大众媒
29、介领域,定比变量常“适用于时间和空间的分析,例如在 上海市大众传播媒体舆论监督特征中设计了媒体批评时间,即事件发生前、事件发生中、事件发生后三个时间段”。46例如,“年代”是一个类目,然后可以用定序测量的方法将其量化为“1998年,1999年,2000年”。下面以铭传大学传播管理研究所研究生王柏蓁的从流行音乐看台湾的爱情价值观:19982007为例进行分析如何建构类目系统和量化系统。这个研究结合量化与定性的内容分析法,分析了1998-2007年十年间“金曲奖”的“最佳流行音乐演唱会专辑奖”的128首歌曲。本研究根据研究问题将内容分析的类目分为三大部分,即歌曲基本资料、歌词整体特性及歌词价值观。
30、一、歌曲基本资料:包括歌曲的名称、主唱者姓名、歌曲年代、主唱者性别等资料。二、歌曲的整体特性:包括歌曲主题、歌曲中所叙述的爱情阶段。三、爱情有关的价值观:包括“对爱情的态度”、“爱情的表达方式”、“表达爱情之肢体动作”、“对于分手的描述”,与“爱情的性别角色”等五大类。(如下图)类目系统类目一类目二类目三编号(变量)语言歌名歌曲主题爱情阶段爱情态度表达方式肢体动作年代性别分手描述性别角色这样就建立了完整的类目系统,接下来,研究者按照各变量的特征建立量化系统。以上图的类目一为例。由于编号和歌名是以填空的方式编码,这里仅讲述对语言、年代和性别三个变量的量化。量化结果如下:语言:国语,闽南语年代:1
31、998,1999,2000,2001,2002,2003,2004,2005,2006,2007主唱者性别:男,女 ,男女对唱(六)制作编码表根据诺因多夫的观点,编码系统的一个重要组成部分是一个全面的手写的编码表。它里面要包含需要研究的变量,并为研究者提供一个连贯一致的研究框架。47辛格尔特里认为,编码表是一种页码,其形式和内容随研究性质不同而各异,它允许研究者记录被计算的项目。编码表只是一页表格,包括编码类别、日期以及编码员姓名等内容(就是将类目等制成表格的形式),所有这些内容都有助于制表和分析。对大多数内容分析而言,每检查一个样本都需要一份表。48此外,诺因多夫还认为,编码表要包含所有与研
32、究相关的信息,也可能会建立一些类目,或者更进一步去确定数据来源的名字。编码表是对已建立的量化系统的赋值。在上一步中,我们已经建立了一个完整的量化系统。接下来,就是对量化系统中的每一个选项进行赋值。以第一类目所建立的量化系统为例:003 张震岳1999年 国语写一封没有地址的信想寄到你的心里告诉你渐渐变淡的爱你是否曾经注意过去的美丽日子已经不再我还在傻傻地找寻也许你想要说但说不出口我知道你想说分手吧 我们分手吧不要在骗我说你还爱著我你我的梦彼此的不同就算是当作一时糊涂爱错一、歌者:二、 语言:1.国语 2.闽南语三、 年代:(1)1998 (2)1999 (3)2000 (4)2001 (5)2
33、002 (6)2003 (7)2004 (8)2005四、主唱者性别:1.男 2.女 3.男女对唱五、歌曲主题:1.爱情2.性3.青春4.政治与社会议题5.风尘、黑道6.励志、打拼7.流浪、思乡8.抒发情感9.其他六、爱情的阶段:1.交往前的爱情2.交往中的爱情3.分手抛弃对方4.分手被对方抛弃5.分手无法判断6.过去的爱情这个编码表还给了我们另一个启示。在一到四题中,答案非常统一,而五六题就会容易出现分歧,这就涉及到了编码过程中的隐性内容和显性内容。显性内容是指可见的表面内容,其编码多接近于标准化的问卷使用,属于定量资料的编码范畴。如上述例子中的一到四题。隐性内容是指分析对象所隐含的意义,是
34、文本中没有明确说出来的内容,区别于它们的显性内容,是定性资料进行编码的对象。这也就更体现了培训编码员的重要性。因为对数据的分析研究要遵循一个一致的编码标准。(七)培训编码员1培训编码员编码员是对研究样本进行编码的人员。编码员可以是学生、教职员、非大学里的成年人或者其他人,他们必须成熟、有能力和负责任。训练编码员的目的是让每一位编码员理解研究者意图,以统一的方式进行编码,理解每个测量指标的含义和每个分类的界定等,掌握编码的流程和技巧。首先,研究者要给与每位编码员一份详细的说明和指导编码的培训材料,即编码说明。编码要对每一个测量指标及其类别进行说明。如之前对变量的界定和测量的确定一样,“编码准则都
35、必须在研究进行之前确定”。49接着,做几个案例给他们进行参考。把自己所做的案例和编码员所做的进行比较。从编码过程中抽出一部分案例,检查其中的编码程序是否正确。只有分类结果一致的编码结果占据了压倒性的比例,才能够继续对总样本进行大规模编码。比如,研究的歌曲样本中出现“爱,分手”等字词,歌曲主题就应该是关于爱情的。如果某编码员坚持把这首歌的主题定义为励志,那他就是不合格的。这位编码员需要接受再次培训接受培训,并重新进行编码。情况仍没有改善,则需要更换一名编码员。编码所依据的原则很重要,它关系到研究进行的一致性和连贯性,但是这并不代表是强制编码员去接受一个统一的标准,因为有些所谓的“编码准则”本身可
36、能就是有问题的。辛格尔特里认为,对编码员的培训不是为了评估编码员的一致性,而是测试他们能否在所给定义的基础上进行合理的判断。一致性不是重点,定义的合理性才是重点。如果在经过适当地思考和训练后,有理性的人不能对某一定义的使用达成共识,那么这个定义可能有问题。此时就需要对定义有问题的变量重新分类。502.内部信度对编码员进行培训以后,要检测编码员之间的内部信度。诺因多夫认为,在当今的文学研究领域,越来越多的人认识到建立编码员内部之间的信度的重要性,这是保证研究效度和研究意义的一个必要的标准。511)霍尔斯蒂公式 : (编码员间信度=2)史考特Pi指数 : 史考特Pi指数【Pi= ,其中的百分比是指
37、每一类百分比的平方和),3)克里鹏多夫的系数(= 1 - ,其中的编码员之间期望的不一致的百分比= 1 - 选择某个项目分类项目的次数(选择每个分类的编号 - 1)】。当结果低于各个公式所对应的可信范围时,内容分析需要重新设计表码表和进行编码。52当研究人自己做编码员时,也要核对编码程序。假设该研究人已经得出了一种印象,认为父母离异的人,容易对社会产生愤怒情绪。这时候容易出现一种危险的情形,当发现某一采访者此时,会下意识地试图从此人的叙述中,寻求任何微小的证据以证明你的假设。此时,应找他人进行编码,并核对双方的分类方法是否一致。下面以从流行音乐看台湾的价值观检测信度为例:研究者从十届金曲奖的研
38、究样本之中,随机抽出一届得奖专辑共10首歌,作检测信度的样本。检测后发现编码员的信度在 0.91 至 1.00 之间,平均相互信度约为 0.96 (参见表一)。由于编码员间的相互信度相当高,因此在检定编码员信度之后即开始进行正式的编码。本研究的前测编码员由本研究者与另一位本校传播管理研究所硕士班的同学担任,并从十届金曲奖的研究样本之中,随机抽出一届得奖专辑共10首歌,作为前测实施的样本。进行编码员的相互信度(intercoder reliability)之检验后,发现各类目的相互信度在 0.91 至 1.00 之间,平均相互信度约为 0.96 (参见表一)。由于编码员间的相互信度相当高,因此在
39、检定编码员信度之后即开始进行正式的编码。表一:分析类目之编码员相互信度检验结果歌曲主题爱情阶段爱情态度表达方式肢体动作分手描述性别角色总类目应有同意数1010211010121083不同意数00310105完全同意数101018910111078相互同意度1.0001.0000.85710.9001.0000.91661.0000.917信 度1.0001.0000.92300.94731.0000.95641.0000.957(八)对资料进行编码在所抽取的样本有足够代表性的前提下,内容分析法所得出结论的客观性程度的高低完全取决于编码的客观情况。可见,编码在内容分析法研究中居于至关重要的核心地
40、位,因它会直接影响着研究成果的客观性。53在具备了编码表已经建立,抽样已经完成,编码员培训已经成功这三个重要因素后,编码员就可以依据编码表对每个样本进行编码,这是将资料转化为可机读格式的操作性阶段。(九)录入计算机和进行统计分析1收回的编码表,或是其他的一些量化内容,录入计算机软件系统分析,进而得到研究结果。当资料为封闭式问题时,研究者可以使用光学扫描单来收集资料。如果资料是问卷收集来的,可以直接对问卷进行编码。然后利用电脑统计软件,将转换成电脑能够识别的数字。辛格尔特里介绍,定性资料使用的软件有资料库,电子数据表程序等,如Nud*ist,侧重对概念进行编码。而定量资料的常用工具包括SPSS和
41、MicroCase等。54M分析方法主要有频数分析和百分比分析。由于很多定性资料都可转化成定量进行统计分析,这里我们以定量资料的统计工具SPSS为例,介绍对资料进行整理和录入的具体操作过程。2. SPSS的使用SPSS的主页面即数据编辑窗口(Data Editor)一般有两个窗口,数据视图(Data View)和变量视图(Variable View)。本文仍然以对台湾流行音乐的主题分析对收集的资料进行编码,先从变量视图入手。例如对“歌曲主题”进行编码。把收集到的数据或者提前设定的选项依次放入变量视图。名称下面输入“theme”;类型为“数值”;小数是指赋值时你所选择的数字小数点后面有几位;然后
42、在值下面进行赋值,这是最核心的部分。点击右侧的方格,会出现一个对话框,在“值”一栏输入所赋予的数值,在“标签”一栏输入被赋值的选项(如,主题有9个,爱情,性,青春,政治与社会议题,风尘黑道,励志打拼,流浪思乡,抒发情感和其它,将他们分别编码为1,2,3,4,5,6,7,8,9。在对话框中,“值”一栏输入“1”,下面的“标签”一栏输入“爱情”,然后点击“添加”,点击“确定”,其它八个也按照相同的方法进行编码);在缺失值一项通常输入9999;最后的度量标准是指变量的类型,即我们上面提到的建立量化体系时的那四个变量。“主题”在此显然是定性变量,即名义变量。然后再回到数据视图中,根据之前的编码对不同的
43、受访对象进行数据的输入。该研究者统计的结果如下:表二:歌曲主题的分布次数与频率歌曲主题次数(%)爱情79(61.7)性3(2.3)青春5(3.9)政治与社会议题8(6.3)风尘、黑道1(0.8)励志、打拼3(2.4)流浪、思乡4(3.1)抒发情感20(15.6)其它5(3.9)合计128(100)(十)报告研究结果报告研究结果时,要注意使结论具体化,以体现研究结果的重要性和方便我们的理解。例如对儿童电视节目内容分析的结果显示30%的广告是点心和糖果广告。那么研究者将如何下结论呢?30%是一个较高数据或者是一个较低数据?我们应当用至少30%,还是仅有30%。显然研究者需要用一些基准来做比较;同其
44、他广告产品或者在成人节目中播出的同类广告产品相比,30%也许是一个很高的比例。55注释:1艾尔巴比.社会研究方法(第十一版).M.北京:华夏出版社,2009.3192 Neuendorf, K. (2002). The Content Analysis Guidebook, Thousand Oaks, CA: Sage Publications.3Roger D. Wimmer , Joseph R. Dominick. Mass Media Research: An Introduction. M. 清华大学出版社, 2007:1504艾尔巴比.社会研究方法M.邱泽奇,译.北京:华夏出版社
45、,2009:323.5 Neuendorf, K. (2002). The Content Analysis Guidebook, Thousand Oaks, CA: Sage Publications.page 536Roger D. Wimmer , Joseph R. Dominick. Mass Media Research: An Introduction. M. 清华大学出版社, 2007:154-155.7 Roger D. Wimmer , Joseph R. Dominick. Mass Media Research: An Introduction. M. 清华大学出版社
46、, 2007:154-155.8陈阳.大众传播学研究方法导论.M.中国人民大学出版社,2007:1989陈阳.大众传播学研究方法导论.M.中国人民大学出版社,2007:199.10 Roger D. Wimmer , Joseph R. Dominick. Mass Media Research: An Introduction. M. 清华大学出版社, 2007:155.11曹琴仙,于淼.基于内容分析法的专利文献应用研究.J.现代情报:2007,12(12):147.12罗秀妆,基于内容分析法对网络行为研究现状的分析. J内蒙古电大学刊:2009,3:75.13 Roger D. Wimmer , Joseph R .Dominick. Mass Media Research: An Introduction. M. 清华大学出版社, 2007:159.14陈凯,孙江华.纽约时报的悄然变脸1990 - 1999 年纽约时报头版.J. 现代传播双月刊:新闻学和传播学版, 2004,2:41.15陈阳.大众传播学研究方法导论.M.中国人民大学出版社,2007:198-199.16Newbold, C., Boyd-Barrett, O. & Van Den Bulck, H. (20