1、 时代呼唤英语教学多元评价目录目录一、评价的定义二、评价的发展历程三、评价理论多元四、评价标准多元五、评价目的多元六、评价主体多元七、评价来源多元八、评价种类多元九、多元测试和测试结果的多元利用 一、评价的定义一、评价的定义评价的定义教育评价:对教育事实作出价 值判断的过程。课程评价:对课程内容及进程 进行的价值判断。评价的定义教学评价教学评价:根据一定教学目的和教学原理,运用切实可行的评价方法和手段,对整体或局部的教学系统进行全面考察和价值判断。教学评价涉及教学目标、教学过程、教学方法、课程、教师的授课质量、学生的学习情况、师生关系和智能、品德发展等各个领域。二、评价的发展历程二、评价的发展
2、历程古代教学评价古代教学评价 学记学记中记载:中记载:“比年入学,中年比年入学,中年考校。一年视离经辨志;三年视敬业考校。一年视离经辨志;三年视敬业乐群;五年视博习亲师;七年视论学乐群;五年视博习亲师;七年视论学取友;谓之小成。九年知类通达,强取友;谓之小成。九年知类通达,强立而不返,谓之大成立而不返,谓之大成”。现代教学评价现代教学评价 注重教学评价的人文主义精神,强调注重教学评价的人文主义精神,强调评价者和评价对象间的不断交互作用、评价者和评价对象间的不断交互作用、共同建构、全面参与的思想。共同建构、全面参与的思想。发发展展趋势趋势:多元:多元评评价价评评价理价理论论评评价价标标准准评评价
3、主体价主体评评价目的价目的评评价种价种类类评评价来源价来源多元评价多元评价评价理论评价标准多元 发展空间 发展时间评价目的多元 甄别选拔、鼓励发展、导向、鉴定、激励、改进、管理、研究(诊断)评价主体多元 教师、学校领导、学生、同学、家长、政府部门、社会(社区)评价来源多元 考试分数、学生活动、档案袋(学生学习成果评选)、数据、经验(直觉)评价种类多元测试和测试结果的多元利用 三、评价理论多元三、评价理论多元理理论论基基础础多元智能多元智能建构主建构主义义后后现现代主代主义义 多元智能理论多元智能理论 八十年代,美国著名发展心理学家、哈佛大学教授霍华德霍华德加德纳加德纳博士提出多元智能理论。霍华
4、德霍华德加德纳加德纳博士指出,人类的智能是多元化而非单一的,由七种紧密关联、但又相互独立的智能组成,每个人都拥有不同的智能优势组合。语语言智能、数学逻辑智能、空间智能、身言智能、数学逻辑智能、空间智能、身体运动智能、音乐智能、人际智能、自体运动智能、音乐智能、人际智能、自我认知智能、自然认知智能我认知智能、自然认知智能八项组成,。1.1.语言智能语言智能(LinguisticintelligenceLinguisticintelligence)是指有效的运用口头语言或及文字表达自己的思想并理解他人,灵活掌握语音、语义、语法,具备用言语思维、用言语表达和欣赏语言深层内涵的能力结合在一起并运用自如
5、的能力。他们适合的职业是:政治活动家,主持人,律师,演说家,编辑,作家,记者,教师等。2.2.数学逻辑智能数学逻辑智能(Logical-(Logical-Mathematicalintelligence)Mathematicalintelligence)是指有效地计算、测量、推理、归纳、分类,并进行复杂数学运算的能力。这项智能包括对逻辑的方式和关系,陈述和主张,功能及其他相关的抽象概念的敏感性。他们适合的职业是:科学家、会计师、统计学家、工程师、电脑软体研发人员等。3.空间智能空间智能(Spatialintelligence)是指准确感知视觉空间及周周一切事物,并且能把所感觉到的形象以图画的形
6、式表现出来的能力。这项智能包括对色彩、线条、形状、形式、空间关系很敏感。他们适合的职业是:室内设计师、建筑师、摄影师、画家、飞行员等。4.身体运动智能身体运动智能(Bodily-Kinestheticintelligence)是指善于运用整个身体来表达思想和情感、灵巧地运用双手制作或操作物体的能力。这项智能包括特殊的身体技巧,如平衡、协调、敏捷、力量、弹性和速度以及由触觉所引起的能力。他们适合的职业是:运动员、演员、舞蹈家、外科医生、宝石匠、机械师等。5.音乐智能音乐智能(Musicalintelligence)是指人能够敏锐地感知音调、旋律、节奏、音色等能力。这项智能对节奏、音调、旋律或音色
7、的敏感性强,与生俱来就拥有音乐的天赋,具有较高的表演、创作及思考音乐的能力。他们适合的职业是:歌唱家、作曲家、指挥家、音乐评论家、调琴师等。6.人际智能人际智能(Interpersonalintelligence)是指能很好地理解别人和与人交往的能力。这项智能善于察觉他人的情绪、情感,体会他人的感觉感受,辨别不同人际关系的暗示以及对这些暗示做出适当反应的能力。他们适合的职业是:政治家、外交家、领导者、心理咨询师、公关人员、推销等。7.自我认知智能自我认知智能(Intrapersonalintelligence)是指自我认识和善于自知之明并据此做出适当行为的能力。这项智能能够认识自己的长处和短处
8、,意识到自己的内在爱好、情绪、意向、脾气和自尊,喜欢独立思考的能力。他们适合的职业是:哲学家、政治家、思想家、心理学家等。8.自然认知智能(自然认知智能(Naturalistintelligence)是指善于观察自然界中的各种事物,对物体进行辨论和分类的能力。这项智能有着强烈的好奇心和求知欲,有着敏锐的观察能力,能了解各种事物的细微差别。他们适合的职业是:天文学家、生物学家、地质学家、考古学家、环境设计师等。9.生存智慧(Existential Intelligence,加德纳后来又补充加德纳后来又补充)另外,有其它学者从内省智能分拆出“灵性智能”(spiritual intelligence
9、)。建构主义的学习观建构主义的学习观 当代建构主义者主张,世界是客观存在的,但是对于世界的理解和赋予意义却是由每个人自己决定的。我们是以自己的经验为基础来建构现实,或者至少说是在解释现实,每个人的经验世界是用我们自己的头脑创建的,由于我们的经验以及对经验的信念不同,于是我们对外部世界的理解便也迥异。所以,学习不是由教师把知识简单地传递给学生,而是由学生自己建构知识的过程。学生不是简单被动地接收信息,而是主动地建构知识的意义,这种建构是无法由他人来代替的。学习过程同时包含两方面的建构:一方面是对新信息的意义的建构,同时又包含对原有经验的改造和重组。这与皮亚杰关于通过同化与顺应而实现的双向建构的过
10、程是一致的。只是建构主义者更重视后一种建构,强调学习者在学习过程中并不是发展起供日后提取出来以指导活动的图式或命题网络,相反,他们形成的对概念的理解是丰富的、有着经验背景的,从而在面临新的情境时,能够灵活地建构起用于指导活动的图式。任何学科的学习和理解都不像在白纸上画画,学习总要涉及到学习者原有的认知结构,学习者总是以其自身的经验,包括正规学习前的非正规学习和科学概念学习前的日常概念,来理解和建构新的知识和信息。即学习不是被动接收信息刺激,而是主动地建构意义,是根据自己的经验背景,对外部信息进行主动的选择、加工和处理,从而获得自己的意义。外部信息本身没有什么意义,意义是学习者通过新旧知识经验间
11、的反复的、双向的相互作用过程而建构成的。因此,学习不是像行为主义所描述的“刺激反应”那样。学习意义的获得,是每个学习者以自己原有的知识经验为基础,对新信息重新认识和编码,建构自己的理解。在这一过程中,学习者原有的知识经验因为新知识经验的进入而发生调整和改变。所以,建构主义者关注如何以原有的经验、心理结构和信念为基础来建构知识。后现代主义后现代主义 后现代主义认为,这个世界是开放的、多元的,在这个以创新为时代精神的社会里,科学技术日新月异,各种新鲜事物层出不穷,创新已经成为社会、个人发展的动力源。承认开放性,也就为充分展示生命的本真提供了大舞台。后现代主义以其兼容并包的宽容态度和尊重个体主体性的
12、宽广胸怀,给生活在这个世界的每个人开放了生命的空间。后现代主义注重过程的思想以及目的与手段统一的观点,均认为个体是在活动的过程中得以不断发展的。对学生的学业质量进行分析有利于发现经验与问题,有利于教育行政部门提高教育决策的水平;有利于教研部门超越个人经验、结合数据进行有针对性的研究与指导,为教学诊断提供依据,从而改进教学过程、提高学生学业质量;同时,对学生学业质量进行分析也是建立规范的教育质量管理制度、引导社会树立正确教育质量观的要求。四、评价标准多元四、评价标准多元发展空间 多元智能理论下的不拘一格降人才。外语人才、英语人才、英语教学人才、英语翻译人才(口译笔译),英语口语人才(同声传译)发
13、展时间 遗传、环境、个人努力程度、机遇、社会评价标准。个人发展时间不同个人发展时间不同 人的发展时间不同,正如自然界花开的时间不同一样。“桃花春色暖先开,明媚谁人不看来”;“毕竟西湖六月中,风光不与四时同,接天莲叶无穷碧,映日荷花别样红”;“待到秋来九月八,我花开后百花杀,冲天香阵透长安,满城尽带黄金甲”;“万树寒无色,南枝独有花。香闻流水处,影落野人家”;“已是悬崖百丈冰,犹有花枝俏”。人达有时,花开有期。春夏秋冬,百花齐放,各得其时,“他年我若为青帝,报与桃花一处开”,这样固然豪迈,但是是完全违背自然规律的,也是完全不科学的。我们教学不能不讲科学,因此,也就必然要正视个体学生的发展时间问题
14、。基于此,我们完全有必要以发展的眼光去看学生,要善于去发现学生的潜能。五、评价目的多元五、评价目的多元 甄别选拔、鼓励发展、导向、鉴定、激励、改进、管理研究(诊断)六、评价主体多元 教师、学校领导、学生、同学、家长、政府部门、社会(社区)共同参与,交互作用。七、评价来源多元七、评价来源多元 考试分数、学生活动、档案袋(学生学习成果评选)、博客、数据、经验(直觉)Portfolio Types使用形式:使用形式:纸质档案袋、电子档案袋(学生学习成果评选、学生个人网页、博客、微博、博客群)八、评价种类多元1.根据评价在教育过程中的作用不同,可分为诊断性评价、形成性评价和总结性评价。2.根据评价采用
15、的标准不同,可分为相对评价、绝对评价和个体内差异评价。3.根据评价采用的方法不同,可分为定性评价和定量评价。4.根据评价主体的不同,可分为自我评价和他人评价。5.根据评价所采用的方法是否传统标准化,可分为传统标准方法和另类评价。美国总统选举 马谡 异地评职称八、评价的基本原则八、评价的基本原则 目的性原则 指导性原则 整体性原则 客观性原则 科学性原则 九、多元测试和测试结果的多元利用1.多元测试和测试学生的多元能力2.对测试结果的多元利用1.多元测试和测试学生的多元能力多元测试和测试学生的多元能力测试不仅仅是高考和学业水平考试、期中期末考试,还应该包括各种测试。应该有符合多元智能理论内涵的各
16、种测试。测试应该包括各种检测和各种考试。像近年来,各个高校开阵的自主招生改革,里面有一些测试就不是纯知识的测试,也不是纯能力的测试,而是多维度的综合测试。像北京师范大学的自主招生试题,测试不仅仅是知识和能力方面,还有心里层面。多元试题多元试题 2010年北京师范大学自主招生试题(面试题):辩论:NBA改成美国职业篮球联赛,对此你怎么看?2011年北京师范大学自主招生试题(面试题)笔试题(主观题)2010年北大自主招生试题里面语文试题里有一道这样的题目:一首流行的网络歌曲,用的是青春组合SHE的中国话的曲调,歌词则经过了重新改编:历史长河向前淌/岸上睡着一只羊/河里漂着一条狼/狼要拿羊当口粮/羊
17、要认狼当爹娘/羊要救狼,狼要吃羊/不知是那羊救狼/还是狼吃羊。题目要求:1、请找出所有押韵的字,并用至少四个造一个单句。2、请找出所有动词,并用其中笔画最少的两个写一句适合大学校园的标语。优化试题 定语从句是修饰或的从句,定语从句所修饰的词叫做。英语课本里的project No bull,just great courses.XiangjiangHighSchool木匠木匠 从前,有个国王整天担心自己的军队吃败仗,害怕王宫的珍宝被抢劫,怀疑大臣不忠心总之,没有一天开心的日子。有一天,国王想:天下的老百姓是不是也像我这般不快活?真难想象普通人靠什么得到快乐。于是,他找来最破旧的衣服,扮成乞丐,去
18、王宫外看个究竟。傍晚时,国王来到了一座破旧的农舍前。农舍的主人正坐在昏暗的厨房里,吃一小块面包,他已经老了,但笑容却灿烂无比。国王忍不住走进去问:“你为什么这么快乐?”“我是个木匠,今天赚了一点儿钱,有晚饭吃,当然开心了。”“如果明天没人找你干活,你还这么快乐吗?”国王问。木匠微笑着说:“快乐和不快乐都是自己决定的,跟别人没关系。”说完,他把面包分成两半,将一半给了“乞丐”。晚上,国王回到宫殿,越想越怀疑:“快乐怎么能由自己决定呢?我非要考验考验他,看他能快乐多久。”于是国王下了一道命令所有木匠必须到王宫门口站一个月的岗。一个月以后国王会给工钱。第二天早上,木匠就被抓来站岗。傍晚,国王换上乞丐
19、的装束去木匠家,他边走边得意地想:看你还怎么快乐!谁知到了木匠家,国王看见桌上不仅摆着面包,竟然还有葡萄酒。木匠热情地请他共进晚餐。国王好奇地问:“你今天的晚餐怎么这么丰盛?”木匠笑着说:“我奉命给国王站岗,要到一个月以后才能拿到工钱,所以我刚才去当铺,用发给我的佩剑换了些钱。你瞧,现在有面包,有酒,多好啊!”“这可是要杀头的啊!”国王故意叫道。“没关系,一发工钱我就把剑换回来,我的手巧得很,要是用木头做把假剑,保证没人能看出来。”木匠胸有成竹地说。第三天早上,国王乔装来到王宫大门口,果然看见木匠的“佩剑”插在剑鞘里,看上去跟真的一模一样。正在这时,有个小偷被侍卫长抓住,侍卫长严厉地说:“偷东
20、西要砍手。你,”他冲正在站岗的木匠说,“用你的佩剑把小偷的右手砍掉!”小偷苦苦哀求道:“我饿得没办法才这么做的,饶了我吧。”木匠的处境可真糟糕,首先他很同情这个小偷,另外他的“佩剑”一旦拔出来就会露馅儿,连国王都替他捏一把汗。木匠眉头一皱,计上心来。只见木匠仰头对天空大声说:“神啊,如果必须惩罚这个人,请给我执行命令的力量;如果可以放过他,请把我的铁剑变成木头的!”说完,他猛地抽出了剑。围观的人发出阵阵惊呼:“变成木头的了!神仙显灵了!”侍卫长不得不把小偷放了。21国王说国王说“我非要考验考验他我非要考验考验他”,这是因为:,这是因为:A 国王不相信快乐能由自己决定。B 天下的老百姓都比国王过
21、得快活。C 国王想知道木匠站岗后能否快乐。D 国王要在一个月后给他发工钱。22第二天晚上,木匠的晚餐非常丰盛,这是因为:第二天晚上,木匠的晚餐非常丰盛,这是因为:A 他用发的佩剑换了些钱。B 他做的木头剑卖了些钱。C 他因为站岗领到了工钱。D 他想邀请国王共进晚餐。23文中说文中说“连国王都替他捏一把汗连国王都替他捏一把汗”,这是因为:,这是因为:A 国王觉得他的处境非常的糟糕。B 国王看出他同情那个挨饿的人。C 国王知道他的剑是假的,怕他被发现。D 国王怕侍卫长把那个小偷的右手砍掉。24文中的小偷最后被放了,这是因为:文中的小偷最后被放了,这是因为:A 神仙显灵,让铁剑变成木头剑。B 木匠拔
22、出来的剑是一把木头的。(3分)C 木匠大声向神请求。D 木匠的计策成功了。(4分)25下面是同学们对木匠的不同评价,你认为最合适的一项是:下面是同学们对木匠的不同评价,你认为最合适的一项是:A 木匠是一个善良的人。B 木匠是一个手巧的人。C 木匠是一个具有神奇魔力的人。D 木匠是一个有智慧、快乐的人。26木匠总是很高兴,这是因为:木匠总是很高兴,这是因为:A 无论遇到什么事情,他总能找到快乐的理由。B 他能想办法换到钱,为自己准备丰盛的晚餐。C 他赚了一点儿钱,有晚饭吃。D 终于见到了扮成乞丐的国王。朱清时说,南方科技大学的学生入校前两年都不分专业,学生学习两年基础课程后,再考虑以后的方向。“
23、南科一梦”加盟者推出。60%高考、30%能力测试,10%平时成绩。西南联大时期。最好的实践和实用。青岛二中自主招生,100多名。实施多元评价的可能性实施多元评价的可能性 考清华北大,对学校非常重要。考适合自己的学校,对自己非常重要。2.对测试结果的多元利用 对学生的学业质量进行分析有利于发现经验与问题,有利于教育行政部门提高教育决策的水平;有利于教研部门超越个人经验、结合数据进行有针对性的研究与指导,为教学诊断提供依据,从而改进教学过程、提高学生学业质量;同时,对学生学业质量进行分析也是建立规范的教育质量管理制度、引导社会树立正确教育质量观的要求。西医与中医。仪器越先进,诊断越合理,治疗越有针
24、对性。超越个人经验、结合数据进行有针对性的研究与指导,为教学诊断提供依据。谈恋爱与电脑搜素。2.对测试结果的多元利用对测试结果的多元利用NBA的统计数据。云南高中学业水平考试量化为22分。综合评价来自老师、家长、学生等(自主招生的介绍信等。主要工具和分析软件主要工具和分析软件SPSSSPSS基础数据分析及抽样误差分析(项目组基础数据分析及抽样误差分析(项目组UNISCOUNISCO)HLMHLM学校间差异及原因分析学校间差异及原因分析PASCALEPASCALE命题质量分析命题质量分析CONQUESTCONQUEST命题质量分析命题质量分析MPLUS MPLUS 试卷结构效度分析试卷结构效度分
25、析CADATSCADATS(项目组)教学诊断分析(项目组(项目组)教学诊断分析(项目组&CEM&CEM)报告反馈生成系统(项目组)报告反馈生成系统(项目组)项目特征与功能项目特征与功能基于课程标准和能力导向基于课程标准和能力导向建立全国常模建立全国常模实施实施“教育健康体检教育健康体检”反馈指导改进教学反馈指导改进教学促进教育持续发展促进教育持续发展绘制绘制“认知图谱认知图谱”全国全国 区域区域 学校学校 班级班级 个体个体公办和民办学校学生学业质量公办和民办学校学生学业质量公办和民办学校学生在语文和数学学科各水平上的人数比例公办和民办学校学生在语文和数学学科各水平上的人数比例不同父母职业学生
26、学业质量不同父母职业学生学业质量 不同父母职业学生在语文和数学学科各水平上的人数比例不同父母职业学生在语文和数学学科各水平上的人数比例 不同班主任任期学生学业质量不同班主任任期学生学业质量 不同班主任任期学生在语文和数学学科各水平上的人数比例不同班主任任期学生在语文和数学学科各水平上的人数比例 测量统计与分析的价值测量统计与分析的价值“通常意义通常意义”的的“成绩分析成绩分析”平均分、最高分、最低分、分布状况等平均分、最高分、最低分、分布状况等分析评价被试学生的学业水平分析评价被试学生的学业水平考试及其试卷(题)的分析与评价考试及其试卷(题)的分析与评价难度、标准差、差异系数、区分度、信度、效
27、度难度、标准差、差异系数、区分度、信度、效度分析评价试卷(题)的质量(有效性)分析评价试卷(题)的质量(有效性)基于统计数据基于统计数据查找试题缺陷,改进命题查找试题缺陷,改进命题教师专业素养的又一视角教师专业素养的又一视角统计的意识与方法统计的意识与方法基于统计数据的分析与改进基于统计数据的分析与改进测量统计与分析的价值测量统计与分析的价值检测、评价学校管理检测、评价学校管理基于统计数据,判断分析学校:基于统计数据,判断分析学校:各种管理要素与办学质量的相关程度各种管理要素与办学质量的相关程度查找学校管理的缺陷,并分析其成因查找学校管理的缺陷,并分析其成因研究改进对策和路径研究改进对策和路径
28、教育测量教育测量=对教育的对教育的“体检体检”统计统计=报告体检结果报告体检结果分析分析=查找并报告病因查找并报告病因示示例例 一道题目的修改:一道题目的修改:原题:原题:修改后:修改后:为什么要修改为什么要修改?学生对原题作答情况:学生对原题作答情况:得分率过低,选得分率过低,选A A的学的学生比例过高生比例过高所考察到的与考试目所考察到的与考试目标不一致标不一致 原题原题:用用3、2、9、0这四这四个数据组成一个最接近个数据组成一个最接近3000的四位数,的四位数,.这个这个四位数是:四位数是:A、2930 B、2903 C、3029 D、3092百分比Valid A45.5 C48.5
29、D6.1 Total100.0分析原因:分析原因:-学生容易对学生容易对“接近接近3000”3000”不不理解,可能认为是小于理解,可能认为是小于30003000。-比较数据由于数量级悬殊不大,比较数据由于数量级悬殊不大,造成学生在比较时的困难。造成学生在比较时的困难。9 9改成改成8 8:修改后学生的作答情况修改后学生的作答情况:修改后的题目:修改后的题目:用用3 3、2 2、8 8、0 0这四个这四个数字组成一个数字组成一个,这,这个四位数是:个四位数是:A A、2803 B2803 B、28302830 C C、3028 D3028 D、30823082 百分比例Valid A1.6 B
30、14.6 C76.9 D6.3 多选.6 Total100.0l统计能够发现好题目的缺陷统计能够发现好题目的缺陷l凭经验很难看出这样的缺陷凭经验很难看出这样的缺陷再看一道题目的修改:再看一道题目的修改:原题原题:阅读篇章阅读篇章徒步旅行徒步旅行材料一材料一:青山森林公园简介青山森林公园简介。材料二材料二:徒步旅行新手指南徒步旅行新手指南(衣物(衣物 饮食饮食 宿营宿营 其他)。其他)。30.30.根据材料所提供的信息,写一张百字左右的野营队员募集根据材料所提供的信息,写一张百字左右的野营队员募集海报。海报。考查能力:考查能力:现代文阅读现代文阅读为了完成任务的阅读为了完成任务的阅读提取信息提取
31、信息能从文本中能从文本中提取相关信息,并使用信息解决相关问题。提取相关信息,并使用信息解决相关问题。分值:分值:4 4分分评分要点:分值分值具具体体描描述述1 1分分 写清楚活动的时间、地点和招募条件。写清楚活动的时间、地点和招募条件。2 2分分能能结结合合第第一一段段和和青青山山森森林林公公园园的的特特点点介介绍绍本本次次登登山山野野营营的的意意义。义。3 3分分能能结结合合第第一一段段和和青青山山森森林林公公园园的的特特点点介介绍绍本本次次登登山山野野营营的的意意义,写清楚活动的时间、地点和招募条件。义,写清楚活动的时间、地点和招募条件。4 4分分能能结结合合第第一一段段和和青青山山森森林
32、林公公园园的的特特点点介介绍绍本本次次登登山山野野营营的的意意义义,写写清清楚楚活活动动的的时时间间、地地点点和和招招募募条条件件,语语言言简简介介,措措辞辞得当。得当。预测的统计数据:预测的统计数据:区分度区分度拟合拟合难度难度不同得分点的人数分布()不同得分点的人数分布()不同得分点与总分的点二列相关不同得分点与总分的点二列相关01234012340.581.040.3531.7627.3613.2123.274.40-0.590.080.180.280.28点评:点评:难度大了,得难度大了,得0 0分的学分的学生比例太高生比例太高点评点评:第第3 3个和第个和第4 4个得分点的个得分点的
33、点二列相关相同。点二列相关相同。应该分数越高,点二列相应该分数越高,点二列相关越大关越大。修改后的题目:修改后的题目:阅读篇章阅读篇章徒步旅行徒步旅行 现代文阅读现代文阅读为了完成任务的阅读为了完成任务的阅读提取信息提取信息能从文本中提能从文本中提取相关信息,并使用信息解决相关问题。取相关信息,并使用信息解决相关问题。3分分考查考查能力能力以下三个要点各占以下三个要点各占1分:分:写清楚活动的时间、地点。写清楚活动的时间、地点。能结合第一段介绍本次登山野营的意义。能结合第一段介绍本次登山野营的意义。能结合青山森林公园的特点介绍本次登山野营能结合青山森林公园的特点介绍本次登山野营分值分值评分评分
34、要点要点修改后实测的统计数据修改后实测的统计数据:区分度区分度拟合拟合难度难度不同得分点的人数分布()不同得分点的人数分布()不同的分点与总分的点二列相不同的分点与总分的点二列相关关012301230.470.950.793.276.0048.5442.19-0.42-0.22-0.020.28点评:点评:拟合和区分度都很好。拟合和区分度都很好。点评:点评:分数越高,点二列相关分数越高,点二列相关越大,好。越大,好。-通过数据统计,对题目进行检测、评价,为修改提供依据。通过数据统计,对题目进行检测、评价,为修改提供依据。好题目?好题目?标准:标准:体现正确的教学理念体现正确的教学理念凭经验可以
35、做到凭经验可以做到符合考试的测量目标符合考试的测量目标测量到的就是要测量的测量到的就是要测量的避避免免把把不不相相关关的的内内容容求和求和凭凭经经验验不不一一定定能能做到做到符合教育测量学的要求符合教育测量学的要求凭经验做不到凭经验做不到修改题目:修改题目:如何更加符合课程的价值如何更加符合课程的价值追求?追求?“学科专家学科专家+教学专家教学专家”“学识学识+经验经验”-质性判断质性判断如何使考试测量更加科学如何使考试测量更加科学?教育测量与统计的理论、教育测量与统计的理论、技术、方法技术、方法基于统计数据基于统计数据寻找题目缺陷寻找题目缺陷作为修改依据作为修改依据 -量化分析量化分析统计图
36、形示例:统计图形示例:影响学生学业成绩的因素影响学生学业成绩的因素各项教育指标:各项教育指标:生师比生师比教师的学历教师的学历班额班额城市、农村、县镇学生所占比例城市、农村、县镇学生所占比例办学条件办学条件学生个体情况:学生个体情况:睡眠时间睡眠时间课外阅读量课外阅读量参加课外辅导的时间参加课外辅导的时间自信心自信心学习动机学习动机学习压力学习压力师生关系、教学方式师生关系、教学方式师生关系师生关系教学方式教学方式学习环境学习环境 对教师教学的评价对教师教学的评价校长对学校的管理:校长对学校的管理:学校办学自主权学校办学自主权国家课程开设国家课程开设校长的教学领导力校长的教学领导力校长对教师专
37、业发展的支持校长对教师专业发展的支持 统计数据及其生成示例:统计数据及其生成示例:学生总体水平分析表学生总体水平分析表 -基于经典测量理论的分析基于经典测量理论的分析操作:用操作:用SPSS计算出表中数据计算出表中数据人数人数总平均总平均标准差标准差最高分最高分最低分最低分偏度偏度峰度峰度200065.8419.5898.006.00-0.544-0.473用用SPSSSPSS计算统计数据:计算统计数据:输入原始数据输入原始数据“文件文件”“打开打开”“数据数据”计算统计数据:计算统计数据:“分析分析”“描述统计描述统计”“描述描述”在在“描述性描述性”对话框中:对话框中:将将“total”选
38、入选入“变量变量”单击单击“选项选项”在在“描述:选项描述:选项”对话框中选定要统计的指标对话框中选定要统计的指标 “继继续续”“确定确定”学生成绩总体分布图:学生成绩总体分布图:用SPSS建立分布图:“图形图形”“旧对话框旧对话框”“直方图直方图”在在“直方图直方图”对话框中对话框中;将将“total”选入选入“变量变量”选择选择“显示正态曲线显示正态曲线”“确定确定”关于关于“偏度偏度”正态分布:正态分布:=0=0负偏(左偏):负偏(左偏):0 0试题难度小试题难度小正偏(右偏):正偏(右偏):0 0试题难度大试题难度大绝对值:绝对值:1 1:比较偏:比较偏2 2:很偏:很偏关于关于“峰度
39、峰度”=0=0说明其峰度与正态说明其峰度与正态分布相同分布相同 0 0峰值人数比正常峰值人数比正常多多0 0峰值人数比正常峰值人数比正常少少 一道题目的区分度统计结果:一道题目的区分度统计结果:1012y2101x难度难度鉴别指数鉴别指数不同的得分点与总分的点二列相关不同的得分点与总分的点二列相关0.64低分组低分组得分率得分率高分组高分组得分率得分率D012340.250.930.68-0.58NANANA0.58点二列相关:点二列相关:XqXq为答错某题的人的总平均分为答错某题的人的总平均分XpXp为答对某题的人的总平均分为答对某题的人的总平均分P P为答对某题的人数百分比为答对某题的人数
40、百分比q q为答错某题的人数百分比为答错某题的人数百分比StSt为总分的标准差为总分的标准差计算点二列相关:计算点二列相关:p p、q q的计算:的计算:“分析分析”“”“描述统计描述统计”“”“频率频率”在在“频率频率”对话框中:对话框中:把需要统计分析的题目号(如把需要统计分析的题目号(如M8ao011x)选入)选入“变量变量”中中“确定确定”计算点二列相关:计算点二列相关:XpXp、XqXq的计算:的计算:“数据数据”“”“拆分文件拆分文件”在在“分割文件分割文件”对话框中:对话框中:选择选择“按组组织输出按组组织输出”把需要统计分析的题目号(如把需要统计分析的题目号(如M8ao011x
41、M8ao011x)选入)选入“分分组方式组方式”“确定确定”“分析分析”“”“描述统计描述统计”“”“描述描述”在在“描述性描述性”对话框中对话框中;将总分将总分“total”total”选入到选入到“变量变量”列表框列表框单击单击“确定确定”计算点二列相关:计算点二列相关:Xq=49.1594Xp=68.8940计算点二列相关:计算点二列相关:直接生成数据的方法:直接生成数据的方法:“分析分析”“相关相关”“双变量双变量”在在“双变量相关双变量相关”对话框中:对话框中:将需要统计分析的题目号(如将需要统计分析的题目号(如M8ao011x)选入)选入“变量变量”将总分将总分“total”选入选
42、入“变量变量”“确定确定”r=0.298鉴别力指数:鉴别力指数:将学生能力按照测验的总分分组:将学生能力按照测验的总分分组:高分组(总分前高分组(总分前25%-33%25%-33%)低分组(总分后低分组(总分后25%-33%25%-33%)两个组在某道题目上通过率或平均得分两个组在某道题目上通过率或平均得分率的差异,即鉴别力指数。率的差异,即鉴别力指数。DD P PH HP PL L鉴别力指数:鉴别力指数:P PHH和和P PL L的求法:的求法:求出前求出前27%27%和后和后27%27%的分数临界值:的分数临界值:“分析分析”“”“描述统计描述统计”“”“频率频率”在在“频率频率”对话框中
43、:对话框中:选入选入“total”total”单击单击“统计量统计量”按钮按钮在弹出的在弹出的“统计量统计量”对话框中对话框中选中选中“百分位数百分位数”在输入框中输入在输入框中输入“27”“27”“添加添加”再在输入框中输入再在输入框中输入“73”“73”“添加添加”“继续继续”“确定确定”鉴别力指数:鉴别力指数:P PHH和和P PL L的求法:的求法:建立分组变量:建立分组变量:“转换转换”“”“重新编码为不同变量重新编码为不同变量”选入选入“total”total”在在“输出变量输出变量”下的下的“名称名称”中填入新的变量名(如中填入新的变量名(如fenzufenzu)“更改更改”“旧
44、值和新值旧值和新值”在在“旧值旧值”中选择中选择“范围,从值到最高范围,从值到最高”,输入高分组分数临界值,输入高分组分数临界值(如(如8282),在),在“新值新值”的的“值值”中输入中输入1 “1 “添加添加”在在“旧值旧值”中选择中选择“范围,从最低到值范围,从最低到值”,输入低分组分数临界值,输入低分组分数临界值(如(如5555),在),在“新值新值”的的“值值”中输入中输入2 “2 “添加添加”在在“旧值旧值”中选择中选择“所有其他量所有其他量”,在,在“新值新值”的的“值值”中输入中输入3 3 “添加添加”“继续继续”“确定确定”鉴别力指数:鉴别力指数:P PHH和和P PL L的
45、求法:的求法:求出求出P PH H和和P PL L:以以“fenzu”fenzu”为准拆分文件为准拆分文件“数据数据”“拆分文件拆分文件”选择选择“按组组织输出按组组织输出”,将将“fenzu”选入选入“分组方式分组方式”“确定确定”分组统计该题的平均得分分组统计该题的平均得分“分析分析”“描述统计描述统计”“描述描述”把需要统计分析的题目号(如把需要统计分析的题目号(如M8ao011x)选入)选入“变量变量”“确定确定”选择题选择题“M8ao011 M8ao011”分别选择分别选择A A、B B、C C、DD的考生的考生总分分布总分分布情况情况箱箱图:图:箱图:箱图:“图形图形”“旧对话框旧
46、对话框”“箱图箱图”在在“箱图箱图”对话框中:对话框中:选择选择“简单简单”单击单击“定义定义”把把“total”选入选入“变量变量”把需要统计分析的题目号(如把需要统计分析的题目号(如M8ao011M8ao011)选入)选入“类类别轴别轴”“确定确定”堆积图:堆积图:选择题选择题“M8ao101M8ao101”分别选择分别选择A A、B B、C C、D D各选各选项的学生中:项的学生中:高分组、低高分组、低分组和分组和“中中间组间组”的人的人数及累积值。数及累积值。堆积图:堆积图:“图形图形”“”“旧对话框旧对话框”“”“条形图条形图”选择选择“堆积面积图堆积面积图”单击单击“定义定义”将将“M8ao101”M8ao101”选入选入“类别轴类别轴”将生成的分组变量(高低分分组变量)选入将生成的分组变量(高低分分组变量)选入“定义堆定义堆栈栈”,“确定确定”小结小结一、评价的定义二、评价的发展历程三、评价理论多元四、评价标准多元五、评价目的多元六、评价主体多元七、评价来源多元八、评价种类多元九、多元测试和测试结果的多元利用