师范大学网络继续教育函数本科2016教育统计与测量评价第一次和第二次作业.doc

资源描述

一、什么是教育测量？什么是教育评价？并阐述一下两者的关系。答： 1.教育测量：教育测量，就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。学校教育实践活动的客观需要，促进了教育测量科学研究及学科发展。教育测量学是一门发展较早、应用较多、内容较丰富的教育科学分支。 2.教育评价：所谓教育评价（educational evaluation）,是指按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统地收集资料信息，对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。 3.教学测量与教育评价的关系：教学测量与评价两者既有区别，又有密切的联系。一方面，教学测量是对学绩测验所得结果的客观描述（将结果予以数量化），并不考虑结果的实际意义，而教学评价则是对学绩测验所得结果的主观判断（对结果进行分析解释），以了解结果的实际意义。另一方面，虽然教学评价是一种主观判断，但是这种主观判断必须以教学测量所得的客观描述为依据。否则，就是主观主义的判断。同样，教学测量也不能脱离教学评价，因为教学测量只是对学绩测验结果的客观描述，只有通过教学评价，才能判断这种客观描述的实际意义。不通过评价，测量所获得的结果也就毫无实际价值。因此，教育测量可以为教育评价提供价值判断的基本数量事实，教育测量是教育评价的基础；而教育评价往往是教育测量过程的延续，是对测量结果的解释与应用，并朝着价值判断与释放教育功能的方向拓展。二、请以你熟悉的一门课程为例谈一下怎样制作命题双向细目表。答：考试命题双向细目表是一种考查目标（能力）和考查内容之间的列联表。制作考试命题双向细目表，是命题工作的一个重要环节。一般双向细目表纵向为要考查的内容即知识点，横向列出的各项是要考查的能力，通常采用识记、理解、应用、分析、综合、评价六个等级。这是按美国教育家布鲁姆(b.bloom)目标分类划分的，是从最简单的、基本的到复杂的、高级的认知能力。以下是我根据人教版小学六年级语文期末试卷制定的双向细目表。范围序号内容能级题型取材分值难度区分度 A B C D E 积累与运用共20分汉语拼音 1 容易读错字字音辩析 √ √ 客观课本 1 2 固定轻声词、多音字辩析 √ √ 客观课本 2 汉字 3 音同形近字辩析 √ √ 客观课本 2 4 音同（近）形异字辩析 √ √ 客观课本 2 词语 5 在语境中辨别意思细微差别的词语 √ √ 客观生活 2 6 在语境中辨别意思相近的词语 √ √ 客观课本 2 7 在语境中辨别词语的感情色彩 √ √ 客观生活 2 8 在语境中辨别词语的感情色彩 √ √ 客观生活 2 古诗文积累 9 体味诗句的内容 √ √ 客观课标附录 1 10 体味诗句的含义 √ √ √ 客观课标附录 1 11 体味诗句的情感 √ √ √ 客观课标附录 1 12 在语境中运用古诗句 √ √ √ 客观生活 3 阅读共40分说明性文章 13 提取信息并做出判断 √ √ 客观报刊 1 14 提取信息并做出判断 √ √ 客观 1 15 提取信息并进行甄别 √ √ 客观 1 16 提取信息并进行概括 √ √ 客观 1 17 提取信息并做出判断 √ √ 客观 1 18 理解词语在语言环境中的恰当意义 √ 主观 2 19 词语运用 √ 主观 3 20 在语境中选择并运用词语 √ √ 主观 3 21 抓住要点、提炼概括 √ √ 主观 6 22 揣摩表达顺序、提炼观点 √ √ 主观 4 23 根据需要搜集信息、整理信息，尝试进行探究性阅读（联系生活常识） √ √ √ 主观 6 24 推想关键词的含义 √ √ 客观 1 叙事性作品 25 推理词语的隐含意 √ 客观课外 1 26 了解事件梗概、整体把握主要内容 √ 客观 1 27 整体把握主要内容 √ 主观 2 28 尝试多角度阅读、敢于提出自己的看法、作出判断 √ √ √ 主观 5 习作40分小练笔 29 表达个人的独特感受、积累习作素材 √ √ √ 主观课外 10 习作 30 提供范围习作 √ √ 主观课外 30 能级：A－知识、B－领会（理解）、C－运用、D－分析或综合、E－评价。说明： 1、能级。“能级”是以布卢姆的教育目标分类理论划分的。布卢姆等人把教育目标分为认知、情感和动作技能三个领域，其中认知领域目标按照由低级到高级分为六个类别，即知识、领会、运用、分析、综合、评价。知识：是最低等级的，是指对具体事物和普遍原理的回忆，对方法和过程的回忆，或者对一种模式、结构或横加的回忆。知识目标强调记忆的心理过程。领会：是最低层次的理解，指个人把某种材料与其他材料联系起来，也不必弄清它的最充分的含义，便知道正在交流什么，并能够运用正在交流的这种材料和观点。它包括转化、解释和推理三种（亚目标）。领会的标志在于，当说明抽象概念的用途时，学生能使用该抽象概念。运用：是指将抽象的概念用于特定的和具体的情境。运用的标志在于，在没有说明问题解决模式的情况下，学生便会正确地把该抽象概念运用于适当的情境。分析：是指导把材料分解成各个组成部分，弄清各部分之间的相互关系及其构成的方式，以指出那些用来传递意义或确定交流结果的技术和手段。包括要素分析、关系分析和组织整理分析三个亚目标。综合：是指将各种要素和组成部分组合起来，以形成一个整体。包括进行独特的交流、制定计划或操作步骤和推导出一套抽象概念三个亚目标。评价：是指为了某种目的，对观念、作品、答案、方法和资料的价值及符合准则的程度作定量和定性的判断。 2、难度。通俗地说，就是得分率（P），即用被试在某题目上的平均分得除以该题目的满分，也可以用被试高分组在特定题目上的得分率和低分组在相同题目上的得分率之和除以二作为题难度（高分组、低分组人数比例各占总人数的27%，其得分率分别为H、L表示），即P＝（H＋L）/2 整个测验所有题目的难度第数分布在0.30至0.70之间，并且整个测验的难度系数在0.5左右时，可使测验对被试有较大的鉴别力，而且可以使测验分数接近正态分布。 3、区分度。是题目区别被试水平能力的程度（D）。通俗地说，区分度就是高水平被试在测验题目上能得高分，而低水平被试只能得低分，那么测验题目区分被试水平的能力就强，如果没有什么差别，区分能力就弱。区分度的值域范围在-1.00至+1.00之间。通常D为正值，称作积极区分；D为负值，称作消极区分；D为0，称作无区分作用。具有积极区分作用的基础上，其D值越大，区分的效果越好。三、几位评委对同一位歌手打分，问评委意见是否一致用什么统计量？并阐述一下该公式中的具体符号意义。答：要知道评委对同一位歌手的评分意见是否一致时，即计算评委所评的分数差异程度的大小，因而，用标准差来衡量。公式：式中：S代表标准差，Xi代表分数，n代表评委人数，是原始数据的平方和；实际上是平均数的平方。 1、已知某选拔考试参加人数为500人，成绩呈正态分布，平均分为70，标准差为10。 ⑴若只能有150人进入面试，问面试分数线定多少合适？⑵90分以上多少人？不及格多少人？答： (1)已知平均分X=70,ϕ(Z)=ϕ{(x-X)/n}=ϕ{(x-70)/10}=1-150/500=0.7 查一下标准正态分布表，得Z=0.53 即（x-70）/10=0.53 故x=75.3 若只能有150人进入面试，确定面试分数线为75.3分。 (2)ϕ(Z)=ϕ{(x-X)/n}=ϕ{(90-70)/10}=ϕ(2) 查一下标准正态分布表，得ϕ(2)=0.9772 故考90分以上的概率为1-0.9772=0.0228，90分以上的人数为500*0.0228=11人。 ϕ(Z)=ϕ{(60-70)/10}=ϕ(-1)=1-ϕ(1) 查表得ϕ(1)=0.84，故ϕ(Z)=0.16 故考不及格的概率为0.16，不及格人数为500*0.16=80人 2、某次考试中选择题与总考试成绩如下表,求该选择题的区分度。（教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示）考生 A B C D E F G H I J 选择题分数 1 0 0 1 1 0 0 1 1 1 总成绩 75 65 67 65 67 56 61 63 58 73 （公式：）答： (1)求答对第一题的比率P和打错的比率q： P=6/10=0.6，q=1-p=0.4 (2)求X1和X2分别为答对和打错选择题学生成绩的平均数。 X1=(75+65+67+63+58+73)/6=66.83 X2=(65+67+56+61)/4=62.25 (3)求答对选择题考生X1的标准差平均分X=65 标准差=开根号(X1-X)²+(X2-X)²+…+(Xn-X)²/10=5.67 (4)求点二列相关系数r r =开根号0.6*0.4*｛(66.83-62.25)/5.67｝=0.396 3、阐述一下假设检验的基本步骤。答：我们可以将统计假设检验的步骤归纳如下：（1）根据题目的设问提出检验假设。（2）选定显著性水平α。（3）写出检验统计量计算公式并按已知数据条件计算检验统计量值。（4）根据显著性水平α在Z分布或t分布中确定临界值和危机域，危机域通常在概率分布的两个尾部，是小概率事件所在地。（5）将求得的检验统计量值与临界值作比较，根据其是否进入危机域而作出是否拒绝虚无假设的统计结论。

展开阅读全文