第三章知觉和模式识别.ppt-资源下载-咨信网-让知识获取变得高效

第三章知觉和模式识别.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二讲知觉与模式识别,一、知觉的基本过程,二、模式识别,知觉的概念,人们通过感官得到了外部世界的信息，这些信息经过头脑的加工（综合与解释），产生对事物整体的认识，就是,知觉,。,感觉,是人脑对直接作用于感觉器官的客观事物的个别属性的反映，它得到的信息，主要是滞留在感觉器官的感受器上的、未经整合的各种具体信息；,知觉,是有组织的信息，它是确定人所接受到的刺激信息并给予它们意义和诠释信息的过程。,一般来说，知觉在感觉之后，但常常是重叠在一起，知觉的发生需要依赖人的感觉，也需要依赖于自己过去的知识和经验。,知觉

2、信息加工过程,觉察,（,detection):,发现事物的存在，而不知道它是什么,;,类似与感觉,分辨,(discrimination):,把一个事物或其属性与另一个事物或其属性区别开来。,确认,(identification):,人们利用已有的知识经验和当前获得的信息，确定知觉的对象是什么。,一自上而下的加工,知觉依赖于感知的主体即知觉者。,知觉者对事物的,需要,、,兴趣,和,爱好,，一般知识经验，或对活动的预先准备状态和期待，在一定程度上影响到知觉的过程和结果。,这种加工叫,自上而下加工,(top-down processing),或,概念驱动加工,（,concept-driven pr

3、ocessing),。,知识经验在知觉中的作用,知觉是一种主动的和富有选择性的构造过程。也就是说，在已贮存的知识经验的参与下，知觉将感觉信息组织成有意义的对象，并把握刺激的意义。,心理学中早已发现的许多事实都说明了知识经验在知觉中的作用，如,斑点图,，言语对知觉的影响等。,Warren(1970,年,),的音素恢复实验,让被试分别听一个不同的句子，其中有某个字母缺失。,It was found that the*eel was on the axle.,It was found that the*eel was on the shoe.,It was found that the*eel wa

4、s on the orange.,It was found that the*eel was on the table.,*,表示该位置的字母告缺失。,被试通常将有缺失的字母听成有意义的词。,(wheel-,车轮,;heel-,足跟,;peel-,果皮,;meal-,饭菜,),理解在知觉中的作用：用过去的知识经验，对知觉对象作出某种解释，使它具有一定的意义。,12,13,14,A,C,知觉的假设考验说,强调过去经验作用的知觉理论：知觉是一个包含假设考验的构造过程，过去的知识经验总是以假设、期望或图式的形式在知觉中起作用。,知觉是一个积极的,(active),和构建的,(constructive

5、),过程；,知觉并不是由刺激输入直接引起的，而是所呈现刺激与内部假设、期望、知识以及动机和情绪因素交互作用的终极产品。,知觉有时可受到不正确的假设和期望的影响。因而，知觉也会发生错误。,Gregory(1972),宣称知觉是一个构建过程，即利用从一些来自感觉器官的不稳定的数据片段和来自记忆的零碎信息去构建针对某一目标的知觉。,因而，提供给感觉器官的时常是不正确的信息，被用作关于外部环境的推理和假设的基础。,二自下而上的加工,知觉依赖于直接作用于感官的刺激物的特性，对这些特性的加工叫自下而上加工,(bottom-up processing),或数据驱动加工,(data-driven proce

6、ssing),。,颜色和明度,知觉,依赖于光的波长与振幅；,音调和音响,知觉依赖于声波的频率与声压的水平；,形状,知觉依赖于物体的原始特征和线条朝向；,知觉,字母首先确认字母的特征，如水平线、垂直线等。,强调知觉只具有直接性质的特点，否认已有知识经验的作用。以,Gibson,为代表。,Gibson,认为，自然界的刺激是完整的，人完全可以利用这些信息直接产生与作用于感官的刺激相对应的知觉经验，根本不需要在过去经验基础上形成假设并进行考验。,强调个体在所处环境中的运动对知觉的影响。,Gibson(1979),把他的理论称为生态学理论,(ecological approach),。,自下而上的加工：

7、直接知觉范式,整合上述两种对立的知觉加工理论,自上而下和自下而上加工对知觉的重要性取决于不同因素的影响。,在良好的知觉条件下，知觉主要是,自下而上的加工；不良知觉,条件下，知觉主要是,自上而下的加工,。,Gibson,强调的是良好条件下的知觉，,Gregory,强调的是不良条件下的知觉。,自下而上的加工,和,自上而下的加工,二者结合而形成完整的知觉过程，或者说，知觉信息是现实刺激信息与过去的知识经验信息相互作用的结果。,视觉加工有两个主要的功能：一是,目标知觉,，即它是什么？二是,空间知觉,，即它在哪里？,神经心理学和认知神经科学的研究表明，大脑中存在两个独立的知觉加工系统：,what,通路,

8、从枕叶,初级视皮层向颞叶下行,主要负责加工视觉刺激的颜色、形状和特性（即刺激的身份或刺激是什么）。,where,通路,则从枕叶,初级视觉皮层向顶叶上行,，主要负责位置和运动信息的加工。,知觉加工过程的脑机制,来自认知神经科学的证据,Haxby,(1994),的,PET,脑功能成像研究,实验一，从两张面部图片中选择与靶图片相匹配的图片,(,物体识别任务,),实验二,从两个由一个点和两条线组成的图形中选择一个由靶图形旋转而来的图片（空间任务）,实验结果,：,1,、两个实验中,枕叶皮层,均有显著激活，表明视觉加工皮层的参与；,2,、实验一导致,颞叶中下部,显著激活；而实验二导致,顶叶皮层,的显著激活

9、Stephan,等,(2003),经典的,fMRI,研究,实验材料,：由德语名词（每个单词包含,4,个字母）组成，其中第,2,或第,3,个字母是红色,实验任务,：,1,字母判断任务,：被试需要忽略红色字母的位置，通过按钮判断单词中是否包含目标字母“,A”,。,2,视空间判断任务,：被试需要忽略词语中跟语言相关的特性，判断红色字母在中心位置的左侧或右侧。,结果,1,字母判断与视空间判断相比，显示出强烈的的左侧一侧化激活，包括标准,语言区,（比如，左侧布罗卡区）；,视空间判断与字母判断相比，显示出在右侧,顶叶皮层,的一侧化激活,疑问？,上述分析没能弄清的问题是：决定某一侧半球加工特定信息的神经

10、机制是什么？,由于刺激中同时包含字母和视空间信息，这需要被试主要关注和加工对当前任务有意义的信息，而抑制对其他信息的加工。,功能连通分析,当,ACC,与其他脑区的联结通过,PPIs,进行分析时，发现了显著的半球间功能分离：,左侧,ACC,在进行字母判断时，与左侧,IFG,（一个重要的语言区）的联结特异性增加；,而右侧,ACC,在进行视空间判断任务时，与右侧顶叶（参与了空间判断）的联结特异性增强。,没有其他脑区显示出跟左侧或右侧,ACC,显著的任务,-,决定的功能联结性变化。,三整体加工和局部加工,自然界中的许多物体是以,等级结构,的形式组成。,人类的知觉系统如何加工等级结构的物体，是长期以来

11、研究争论的热点。,Navon(1977),开创性地采用,等级刺激,的范式来研究人类的等级加工过程。,Navon(1977),：,听觉的字母识别作业,整体加工和局部加工,实验程序,视觉刺激,80ms,，,其中开始呈现后,40ms,给听觉呈现,H,或,S,，,听觉刺激持续,300ms,，,要求判定听到的是哪个字母，按键记录反应时。整个实验中，被试始终注意视觉刺激（视、听有,40ms,的重叠）。,听觉刺激与视觉刺激整体的字母有,3,种关系：一致、无关、冲突；,听觉刺激与视觉刺激局部的字母有,3,种关系：一致、无关、冲突；,听觉辨别反应时依赖于,听觉刺激,与,视觉刺激,的,整体的,一致关系；,而听觉辨

12、别反应时在,3,种局部的一致关系下并无显著差异。,视觉的字母识别作业,视觉刺激材料同前；,每次只呈现一个刺激；,两组实验：注意整体（要求被试指出所看到的大字母是,H,还是,S,）；,注意局部（要求被试指出所看到的小字母是,H,还是,S,）,实验过程：先注视光点，呈现刺激,40ms,，,呈现掩蔽刺激，要求尽快作出判定，且尽可能保证准确。,大字母识别快于小字母；,3,种关系条件下，,大字母,识别反应时无显著差异；,小字母,的识别有差异，其中冲突条件下最慢。,知觉加工的总体特征优先,总体特征知觉先于局部特征被知觉，知觉过程开始于总体组织，然后才开始对局部特征的分析。,当人有意识看总体特征时，知觉加工

13、不受局部特征影响，但当人注意看局部特征时，知觉加工受总体特征影响，否则无法解释小字母识别在冲突条件下最长。,整体加工,和,局部加工,主要针对刺激的物理特征而言,；,自上而下的加工,与,自下而上的加工,更多针对意义特征而言。,第二节模式识别,模式,是指有若干元素或成分按一定关系形成的某种刺激结构，也可以说模式是刺激的组合。,比如,：几个线段组成一个字母或图形，几个笔画组成一个汉字、一个人头像，几个音素组成一个音节等。,什么叫做模式？,什么叫模式识别？,定义：当人能确认他所知觉的某个模式是什么，并与其他模式区分开来，这就是,模式识别,。,模式识别,也就是指当人们把接收到的有关客观事物或人的刺激信

14、息，与他在大脑里已有的知识结构进行比较和匹配，从而辨别和确定该刺激信息意义的过程。,存在各种感觉通道的模式识别：视觉的、听觉的、触觉的、味觉的、和嗅觉的模式识别。,模式识别是人的一种基本的认知能力或智能，在人的各种活动中都有重要的作用。,若能将模式识别赋予计算机（机器识别），则将具有重要作用，此即,人工智能,的一个重要研究领域。,模式识别的作用,模板匹配模型,原型匹配模型,特征分析模型,有关模式识别的理论假说,理论：在人的长时记忆中储存着各式各样的过去在生活中形成的外部模式的袖珍复本，这些袖珍副本被称为模板（,Template),。,当刺激作用于人的感官时，刺激信息得到编码并与各种模板进行比较

15、哪一个模板与刺激有最佳的匹配，就把该刺激确认为与那个模板相同，从而得到识别。,模板匹配模型,模板说存在的证据,Phillips(1974),让被试判断两个先后呈现棋局模式的异同，两个模式的空间关系有两种情况（,1,）重叠：两个模式在同一位置上出现；（,2,）位移：第二个模式相对于第一个模式做水平方向的位移。,结果,：当两个模式呈现的时间间隔短于,300,毫秒时，重叠条件的正确率高于位移条件，但是当时间间隔长于,600,毫秒时，出现相反的结果,.,这说明，在视觉储存的时间内，两个模式的空间重叠是有利于识别的，也就是说模板匹配在模式识别中是起作用的。,Warren(1974),声音异同判断实验：

16、当两个声音刺激的持续时间严格匹配时，声音高低的异同判断成绩要优于持续时间不一致的情况。,实践应用,证据：用模板技术制作一些特殊的数字，用于支票的银行帐户、信用卡、提款卡等的编号。计算机可以成功的作出识别。,这些实验结果说明，模板说在一定的条件下可以解释人们的模式识别。,条形码,分为,4,个部分,：,1-3,位：,国家代码,（由国际上分配，,690-695,都是中国的代码）；,4-8,位：生产,厂商代码,，由厂商申请，国家分配；,9-12,位：,厂内商品代码,，由厂商自行确定；,第,13,位：,校验码,，依据一定的算法，由前面,12,位数字计算而得到。,对模板说的质疑,按照模板说的基本观点，为了

17、识别特定的模式，必须事先在记忆中存入与之对应的模板。如果两个模板在外形、大小和方位等方面必须匹配才能得到识别的话，就需要在人的记忆中储存,不可计数的模板,，这显然不现实，也与人识别物体时表现出的高度灵活性不一致。,对模板说的修改,鉴于上面提出的质疑，有人模板匹配模型进行了修改，提出了一个,预加工,(Preprocessing),过程。,即在模式识别的初级阶段，预加工将刺激的大小、方位、外形等加以调整使之标准化。这样就可以减少模板的数量。,对模板匹配说的评价,能解释人的某些模式识别现象，但缺乏灵活性，人必须事先存储相应的模板，才能识别一个模式。即使附加了预加工过程，这些模板的数量仍是巨大的。,模

18、板说不能完全解释人的模式识别过程，只能充当识别过程中的,一个方面,或,一个环节,。,原型说,是基于模板说的不足基础上提出的。,原型说,认为在记忆中存储的信息是以原型,(Prototype),的形式存在的。模式识别就是要确定一个物体是否与在原型中找到的基本形式相匹配。,原型,不是某一特定模式的复本，而是同一类别或范畴的所有客体的概括表征，反映一类客体具有的基本特性。例如，带着两个翅膀的长筒可以作为飞机的原型。,原型匹配模型,是否存在原型？,Posner(1967),利用,9,个点构成几种基本模式，如三角形、字母,M,或,F,以及随机点模式（下图），这些基本模式被当作原型，然后对某些点加以移动构成

19、四个畸变图式。,原型畸变的三角形,实验：第一步：要求被试看其中三种原型的畸变模型，并将每个畸变模式划入某个范畴（原型），即要求被试将每个原型的,4,个畸变模型归为一类，每次归类操作给予反馈。此阶段不给被试看原型。,(,学习阶段,),下一步：呈现给被试原型、原有的畸变模式和基于原型的一些新的畸变模型。要求被试将这些模式分别划入上述,3,个范畴。,一个实验（,Posner,，,1967,）,结果：被试对原型和原有畸变模式分类正确率都为,87%,左右，对新的畸变模式的分类较差。,该结果表明，被试在学习实验中已经形成了某种原型，因而在随后的实验中产生了明显的迁移效应。,原型匹配的特点,原型是一种概括

20、表征，只需要近似匹配即可。,即使个体间存在外形、大小等方面的差异，也可以被相应的原型所识别。,减轻人的记忆负担，使模式识别更灵活，更适应环境的变化。,Ehrsson,（,2007,）,灵魂出窍体验,（,Out-of-Body Experiences,）,在科学史上，有许多濒临死亡的病人在被抢救回来后，报告说他们感到自己漂浮在空中，或是看到医生抢救自己的情景。,英国和瑞士的两组科学家，日前通过技术手段，分别在健康人身上模拟了这种感觉,证明“意识离开身体”不过是大脑的一种错觉,。,在实验中，参与者都戴着一副虚拟现实眼镜，它与一台对准参与者自身的摄像机相连。,研究人员在将一根塑料棒移向摄像机镜头的同

21、时，准确地在,参与者,的胸部刺了一下。,在这种情况下，参与者很强烈地认同了摄像机中的位置，并且认为他们自己的位置就处于那里。而且，这种感觉与他们平常观看其他人并无二异。,Ehrsson,表示，,人们通常,感受到自己处于身体之内,。不过，新的实验设计让大脑所得到的信息与这种通常观念不符，才发生了体外经历。,他说，“,大脑会骗自己，因为它要让,各种感官信息变得有意义,。如果这些信息是有缺陷的，那么它就会产生错误的认识。,”,这种幻觉的出现可能源于特定大脑区域的故障，比如整合感官信息的大脑,颞顶皮层（,tempoparietal,cortex,）,。,模式是有若干个元素按照一定的关系构成的，特征说把

22、这些元素和关系称为特征,(Feature),，,并认为模式可以分解为特征。,例如，一个大写的英文字母“,A”,可以被分解为：两条斜线、一条水平线和三个锐角。,三：特征分析模型,特征分析的过程,在模式识别过程中，首先要对刺激的特征进行分析，也即抽取刺激的有关特征，然后将这些抽取的特征加以合并，再于长时记忆中的各种特征进行比较，一旦获得了最佳匹配，外部刺激就被识别了。,实验证据之一：字母特征混淆,Neisser(1964),比较了由直线组成的干扰字背景（如,W,、,V,）,和由圆形特征组成的干扰字母（如,O,、,G,）,中检测出字母,Z,的时间。,词表,1,词表,2,IMVXEW ODUGQR,W

23、VMEIX GRODUQ,VXWIEM DUROZG,MIZWVX RGOUDQ,实验程序：,1,、呈现,6,个一行的英文字母，要求被试尽快搜索特定的靶子字母“,Z”,2,、两组刺激材料的不同之处在于，靶子字母和其他字母在特征上的相似程度。（高相关和低相关）,3,、结果表明低相关条件下，搜索靶子较快。这可能是因为，干扰字母和“,Z”,没有多少共同特征的缘故,4,、该结果说明，在人的模式识别中，特征分析是一个必经的阶段。,实验证据之二：,支持特征说的有力证据还来自生理学的研究。许多生理实验发现，动物的视觉系统含有一些专门化的神经细胞，它们只对一定的特征作出反应。,比如,Hubel,和,Wiese

24、l(1959),发现，猫和猴的一些视觉皮层细胞分别只对视野中的垂直光条和水平光条发生反应。,后来还发现分别存在着对边界、线条、甚至对成直角的刺激图形发生反应的特定细胞。,1,、依据刺激的特征和关系进行识别，就可以不管刺激的大小、方位等细节信息及预加工,2,、同样的特征可以出现在不同的模式中极大减轻记忆的负担。,3,、抽取刺激的特征再加以综合，使模式识别过程带有更多的学习色彩。,特征说的优点,“鬼城”模型,Selfridge(1959),提出了一个更为具体的特征分析模型,“,鬼城”模型,“鬼城”是形象的比喻，原意是指一个幻想国度中的一个喧嚣而又混乱的城市。这里，所谓的“鬼”是指具有某种特定功能的

25、机制。本来是针对机器的模式识别提出来的，后来用于人的模式识别。,该模型将模式识别分为四个层次，每个层次有一些“鬼”来执行某个特定的任务，这些层次按顺序进行工作，最后达到对模式的识别。,第一层次由,“映象鬼”,对外部刺激进行编码，形成刺激的映象。,然后由第二层次的,“特征鬼”,对刺激的映像进行分析，既将它分解为各种特征：在分析过程中，每个“特征鬼”的功能是专一的，只负责一种特征。并需要对刺激是否具有相应特征进行报告。,第三个层次的,“认知鬼”,始终监视各种特征鬼的反应，它们从特征鬼的反应中寻找各自负责的那个模式的有关特征，当发现特征时，就会喊叫，发现特征越多，喊叫声越大。,最后,“决策鬼”,根据

26、这些认知鬼的喊叫，选择叫声最大的那个认知鬼所负责的模式进行识别。,映象鬼特征鬼认知鬼决策鬼,刺激编码分解为各个特征检测特征鬼选择叫声最大的,线段、直角等发现特征喊叫的鬼负责的模式,“鬼城”模型的发生过程,对特征分析模型的评价,特征分析模型是目前最受关注的一个模型，和模式识别模型相比较，具有更加灵活的特点。,但它只是自下而上的加工模型，缺少自上而下的加工。,特征分析模型一个最大的问题，就是关于整体加工和局部加工的问题。,特征优先还是整体优先？,特征加工认为视觉,加工过程是从局部,分析再到整体的过,程。然而，,Navon,(1977),等的实验表,明，整体加工优先,于局部加工。,影

27、响等级加工的因素,知觉因素,（如视角、离心率、知觉组织）,注意因素,（如重复启动效应）,人格因素,（如谨慎型、激进型）,情绪因素,（如沮丧、开心）,结构优势效应,过去的经验对知觉有重要作用，并常表现为上下文效应。这表明模式识别并不是孤立的，而是处在和其他模式或刺激的相互联系中。,现在已经发现了,字词优势效应,、,客体优势效应,、,结构优势效应,和,字母优势效应,。,定义：,识别一个字词中字母的正确率高于识别一个单独的同一个字母。,Reicher(1969),的实验,刺激材料,：,他用速示器给被试呈现一组刺激材料，激材料分三类：,一类,为一个或两个单独字母；,一类,为一个或两个由四个字母组成的字

28、词；,第三类,为一个或两个由四个字母组成的非字词。,之一：字词优势效应,：,实验程序,首先,给被试呈现一个注视点，然后呈现上述刺激材料中的一种，刺激的呈现时间分为短、中、长三种,.,紧接着,呈现掩蔽刺激和供选择的两个字母。,要求,被试回答这两个字母中的哪一个是刚才刺激材料中这个位置上看见过的，记录正误。,实验结果,无论事先告不告诉所供选择的字母，识别字词中一个字母要优于单个字母或者非字词中的字母。显示出了字母识别中的字词优势效应。,对字词优势效应的解释,一：推论说,Rumelhart,和,Siple(1974),指出，对字词中的字母只要看到这个字母的一部分就可以排除其他选择，得到正确识别。这种

29、解释是借助上下文进行推理来解释字词优势效应的。,例如，在字词,WORD,中，最后一个字母,D,，被试只要看到后部的曲线，就能正确识别它为,D,，而对于单个字母,D,，被试即使看到同样的曲线，他也不能确认这个字母是,D,，,Q,，或,O,。,这种解释强调以过去知识经验为基础的自上而下的加工和缀字规律知识的应用。,二：编码说（字词和字母的不同编码）,Mezrich(1973),发现，被试在作出反应之前常有将字词读出的倾向。他发现如果在反应之前要求被试把所有字词和单个字母都读出来，那么字词效应将消失。,对字词优势效应的解释,另外，,Johnston,等发现如果在,Reicher,的实验中，不用掩蔽刺

30、激，就不会出现字词优势效应。,这说明字词优势效应是由于字词和单个字母的不同编码所造成的：字词是语音编码，而单个字母是视觉编码，视觉编码易受视觉掩蔽的干扰，语音编码则不会。,三：整体加工优势,从整体加工和局部加工的关系来解释字词优势效应。,将字词看作整体，而将单个字母当作局部，字词将先得到整体加工，然后在加工局部。,对字词优势效应的解释,Earhard,用总体分析和局部分析的观点来解释这一现象。照他的看法，客体优势效应并不依赖图形的三维性，而是依赖总体分析的作用，而且总体分析为局部分析提供基础，使对靶子线段的编码、辨别、注意等操作易于进行。,Earhard,还进一步研究了其他影响客体优势效应的因素，如改变注视点位置。,Marr,的计算理论,该理论认为，,视知觉,包括了,三种视觉环境信息的表征和描述,，它们是：,要素图：,二维属性，包括轮廓、边界、斑点等。它可以通过光的强度变化获得。,2.5,维度要素图：,这种表征是阴影、双眼视差、运动等方面的信息，从而形成事物的相对深度和表面属性的描述。,三维模型表征,：当模式在视觉刺激下，建立起三维模型的表征，并迅速与长时记忆中存储的视觉三维模型表征匹配时，模式就被识别。,Marr,计算理论的最主要贡献是阐明了模式识别过程中涉及到的信息加工过程，这比原来所设想的复杂得多。,

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

第三章 知觉和模式识别.ppt