资源描述
应用马尔可夫链评价教学质量
【摘要】 目的: 讨论教学质量评估中的一种定量分析方法——时齐马尔可夫链评估法[1],并阐明该评估方法的理论依据及其实施程序。方法:利用学生历年的成绩建立一个马尔可夫链[2],运用SAS的IML模块进行统计分析。结果: 指出时齐马尔可夫链评估法较之其他教学质量评估法更显合理,更具有实用性和有效性。结论: 教学质量的时齐马尔可夫链分析着眼于教学过程,注重“历史经历”,从而为更准确地评价教学质量提供了可能。
【关键词】 教学质量 时齐马尔可夫链 评估 转移概率矩阵
建立教学质量评估体系,对于提高教育教学质量有着积极的意义。如何建立科学而有效的教学质量评估方法,充分发挥教与学两方面的积极性、互动性和创造性,是摆在教学研究面前的重要课题。
在对比评估不同班级的教学效果时,往往以每个班学生的期末考试成绩为依据,根据各班考试成绩的变化趋势来判断其优劣。事实上,这样评估方法会带来极大的片面性。因为不同班级的学生基础存在差异,这让评估的结论偏颇,失去公正性。为了能客观、公正地评价各个班级的教学效果,必须剔除班级之间学生的基础差异这一因素的影响。笔者经过比较分析,建议对教学质量的评价使用时齐马尔可夫链评估法。
马尔可夫链评估法是一种以概率论和随机过程理论为基础,建立随机数学模型分析现实活动变化发展过程中数量关系的一种定量分析方法[3]。其研究的是一类重要的随机过程,研究对象的状态Xn (n=1,…,k)是不确定的,其状态空间为I,它有时可取K种状态,有时甚至可取无穷多种状态。在建立随机数学模型时,时间变量被离散化。我们希望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研究其变化规律,而马尔可夫链评估法研究的也是一类状态转移问题。即研究对象的转移矩阵决定了马尔可夫链模型的性质。
若对任意的i,j∈I,马尔可夫链{Xn,n∈T}的转移概率pij(n)与n无关,则称马尔可夫链为时齐的(对时间齐次的)[4]。故对任意k步转移概率pij(n,k)都与n无关,且均可由一步转移概率决定[5]。根据教学规律与教学质量评估的需要,时齐马尔可夫链评估法恰到好处地体现其在教学质量评估中的实用性与有效性。
1 原理与方法
数学模型
在教学效果指标的量化过程中,时齐马尔可夫链评估法是将一个总体(如一个年级、一个班甚至一个小组)的个体在某次考试中获得的成绩划分为若干等级——优、良、中、及格和不及格,对应地将考试分数划分为90~100分、80~89分、70~79分、60~69分、0~59分5个等级。然后以各等级学生人数占总人数之比作为状态变量[6],总体各自的学生前一学期的考试成绩为初始状态,并用向量(概率分布序列)表示
R(t) = (X1(t) X2(t) X3(t) X4(t) X5(t))
其中t(t∈N)是时间,显然有5i=1Xi(t)=1 。
我们根据马尔可夫过程的无后效性[7],研究当t变化时,状态向量R(t)的变化规律,从而对教学效果进行评估。
设经过第一次考试,一个总体的学生中获得优、良、中、及格和不及格的学生分别为ni (i = 1,2,3,4,5),则状态向量R(1) =( n1n n2n n3n n4n n5n ) 被称作初始向量[8]。
为了考察教学效果,继续分析下一次考试中,上述各等级学生的变化情况。若经第二次考试后,原来获得优等成绩的n1名学生中,仍保持优等者为n11人,下降为“良”者有n12人,下降为“中”者有n13人,下降为“及格”者有n14人,下降为“不及格”者为n15人,于是我们得到第一次考试成绩的转移概率为( ni1n ni2n ni3n ni4n ni5n ),这一转移变化情况用矩阵表示为P =( niini )5×5 =〔pij〕。
P称为转移概率矩阵[9]。容易看出
① 5J=1pij=1 (pij≥0, i=1,2,3,4,5)
② R(2) = R(1) P 即
R(2)=
根据时齐马尔可夫链的性质[10],我们有
① R(t+n)= R﹙t﹚Pn (n∈N)
② R(t)的极限为时齐马尔可夫链在平稳状态下的概率分布:linn→∞R﹙t﹚= R 。
这里要说明的是:在平稳状态系统内部各等级学生之间的微观变化依然存在,但各等级的学生的相对比例不再发生变化。特别地,如果矩阵P为分块对角,表示每一等级的学生均可向任一等级变动,则根据马尔可夫链的无后效性(要预测“将来”的状态,只需清楚“现在”已知的状态,而“过去”的状态不起任何作用),体系的极限状态与体系的初始状态关系甚微,即与R(1)无关,而一切由转移概率矩阵P决定[11]。所以,马尔可夫过程转移概率矩阵P在教学评估中的意义是至关紧要的。学生考试成绩的变化反映了学生内在心理状态、外部社会影响、教师授课方式等综合的变化。因此,转移概率矩阵P是教学质量、教学条件、学生内在心理状态、外部社会影响等因素的集中反映。由马尔可夫过程的极限状态可知:当这些影响学生考试成绩的因素稳定时,学生在这种设定情况下的总体上可能达到的程度,而这一可能达到的程度与学生原有的基础无关。于是,在理论研究上我们可运用马尔可夫过程的极限分布作为教学效果的量化指标,从而也解决了因学生基础存在差异而无法以学生的成绩去评估教学质量的难题。
计算步骤
为了方便研究问题,我们不妨将求教学系统状态转移概率矩阵P的极限向量的步骤归纳
① 分层抽样,在我校的二级学院抽出预防医学方向M、N两个班。为方便说明问题,摘录“M班02–03上学期与02–03下学期考试成绩转移情况表”(原始资料来源于广东药学院教务处),如表1所示,列出各班级的学生考试成绩等级转移情况表,其中第6列表明该生在两次考试中成绩转移情况,如:i→j意为该生由i等转移到j等。表1 M班02–03上学期与02–03下学期考试成绩转移情况表
② 计算转移概率矩阵P,矩阵P中元素pij由下式确定:pij=nij5j=1nij i,j={1,2,3,4,5}
③ 求出转移概率矩阵P的极限向量。
由马尔可夫链的遍历性定理知:对于不可分、非周期的马尔可夫链的n步转移概率矩阵〔p(n)ij〕,由无后效性有: linn→∞p(n)ij=xj
这里,xj与i无关。此时,x≥0 , X = { xj} = ( x1 ,x2 ,x3 ,x4 ,x5)≠ 0为状态R平稳分布,且满足X=XP,即X[I–pij] = 0 (I为单位方阵),
或[I–pij] x1x2x3x4x5=00000
故转移概率矩阵P的极限向量X是其转置矩阵PT=[pji]的特征值为1的特征向量。
考虑到PT的特征方程的线性相关性,我们可删去方程组中的任一方程,而用约束条件5i=1xi=1替代。
④ 解出向量X = (x1 ,x2 ,x3 ,x4 ,x5),即为P的极限向量[12]。根据最大项原则,可取max{ x1 ,x2 ,x3 ,x4 ,x5}所在等级表示工作质量等级,通过S = 80x1 + 70x2 + 60 x3 + 50x4 + 40x5算出教学质量评估综合得分进行量化比较评价。
特别的,当转移概率矩阵P为分块对角矩阵时,特征方程[I–pji] X= 0无唯一解。此时,可通过增加约束条件,使方程组的解具有唯一性[13]。比如,若[pji]形如
p11p12p1300
p21p22p2300
p31p32p3300
000p44p45
000p54p55
则有x4 + x5 = x4(1) +x5 (1),其中x4(1)、x5 (1)分别为初始向量R(1)中的两分量。
实例分析
广东药学院公共卫生学院预防医学方向M、N两个班自02年入学始到07年毕业所学科目基本相同,且由不全同的教师担任其课程。倘若在一次考试中,M班的平均成绩都高于N班。能否认为M班的教学效果比N班的教学效果优秀呢? 其实不然,因为M、N两个班入学时,各班学生的基础存在一定的差异。为了能将学生的基础差异这一因素排除,我们采用时齐马尔可夫链评估法。
分析M、N两个班第1学期到第9学期共9次期末考试的平均成绩及每相连两次考试的所属等级转移情况。计算相同的i→j在表中出现的频数,求得相应的转移概率矩阵,算出P(n)M、PT(n)M、P(n)N、PT(n)N。
① 求PT(n)M的特征值为1的特征向量:
解方程 [I -PT(n)M] XTM= 0
解之 XM=
② 求PT(n)N的特征值为1的特征向量
解方程 [I-PT(n)N] = 0
解之 XN =
根据最大项原则,我们的结论是:N班的教学效果良好,而M班的教学效果只属中等水平。
为了进一步说明两个班的教学效果的定量指标,预先给每个等级确定分值如“优”为80,“良”为70,“中”为60,“及格”为50,“不及格”为40,则:SM=×80+×70+×60
= =×70+×60+×50
=
由此可见,SM≈SN,即M班教师的教学效果与N班的一致。
为了验证时齐马尔可夫链评估法的灵敏性,计算M、N两个班各自9个学期的总平均分及标准差。运用统计软件SAS的Means过程,得出M 班9个学期的总平均分M= ,标准差是SM = ;而N班9个学期的总平均分是N= ,标准差是SN = 。可见,M≈N,即这两个班九个学期的总平均成绩极为相近,而且SM≈SN ,表明M班内学生的成绩之间变异与N班一致,即两个班成绩离散趋势一致。跟时齐马尔可夫链评估法得到的结果完全吻合。
时齐马尔可夫链评估法较灵敏地反映了教学过程的发展变化状况,结论是客观的。从所给的数据作简单分析,虽然两个班级在校9个学期的期末考试平均成绩可作比较并粗略得出我校的教学质量,但两个班的基础存在一定差异,这样得出的评价是不符合现实的。在教学质量对比评估过程中,由于各班学生的来源各异、基础不等…,这都是必须考虑的因素。上例中,广东药学院公共卫生学院预防医学方向M、N两个班经过5年的教育栽培,M班最终的平均成绩为,而N班是,换言之,M班的教学效果与N班的教学效果基本持衡。由此推出广东药学院公共卫生学院的教学效果比较均衡。
2 讨论
教学质量的时齐马尔可夫链分析着眼于教学过程,注重“历史经历”[14]。因此,对于有着前后因果联系的教学过程,此方法较其他教学评估的方法更合理。也正如此,在教学过程的诸多方面得到卓有成效的应用。
① 教学工作质量的对比评估[15]。在评估过程中,由于学生的来源各异,基础不等,因此仅仅依据学生的学习成绩,几次课堂教学听课,学生评教、教学抽检来评价教师的教学或学校管理工作的质量,则存在片面性。而时齐马尔可夫链评估法提供了解决这一矛盾的有效手段。通过上例的演示,可见它是一种较合理的教学评估法。
② 教学实验或实习的对比评价。在教学实验或实习评比中,由于各种外部条件得到较严格控制,同时该方法剔除了一些差异问题,因而能得到较准确的结果,为实验或实习提供有参考价值且有一定可信度的数据。
③ 教师的因材施教情况的分析。由于转移概率矩阵P本身包含着大量信息,可以从中分析到学生各层次之间的变化状况。而且,时齐马尔可夫链分析的过程中也得到了教学效果的各类数据,教师能对教学实践作出自我检测,从而有针对性地采取多种措施,探索教学规律,改进教学方法,做到因材施教。
④ 试卷分析和标准考试的质量分析。
⑤ 教材选用、教学内容的合理性分析。
⑥ 双语教学的效果评价。
⑦ 学生的学习成绩的预测。
⑧ 体育教学中学生的身体素质的变化分析。
不过,最佳的方法也不可能是完美无缺的,作为一种定量分析方法——时齐马尔可夫链评估法自然也有它的局限性。首先它忽略了学生在两次考试之间的特定外部气氛(如家庭或社会环境的差异);其次忽略了前次考试成绩的优劣对学生的心理影响(如骄傲或自卑,满不在乎或压力重重等);再则,试题的命题风格,评卷教师的宽严,以及考试课题自身特点,考试方法,考题的难易等;另外,学生学习成绩可能有升降,不同的等级变化到另外的一个等级或等级不变所反映的教学水平是不一样的,如将一个等级为不及格的学生学习成绩提高到优秀,显然就比将一个等级中等的学生学习成绩提高到优秀要困难得多。以上这些因素无不直接或间接影响到学生考试平均成绩的高低,它们不可分离的都在转移概率矩阵P中体现出来。因此,仅用“分数”对教学质量进行评估是不够科学的。教学质量的马尔可夫链评估是以考试成绩为依据的,因此,考试的质量直接影响到马尔可夫链分析的质量。剖析这种局限性有助于我们在实践工作中正确地加以应用,并不断加以改进,渐臻完善。充分考虑到这些因素,时齐马尔可夫链评估法能够更加客观,更加符合实际地反映出教学水平。
【参考文献】
1 黄歌润,盛炜.教学质量评估的一种统计方法.应用概率统计, 1996,12:108~110.
2 复旦大学,编.概率论.第3册.北京:高等教育出版社,1981.
3 中山大学数学力学系,编.概率论与数理统计.下册.北京:高等教育出版社,1987,304~314.
4 刘次华.随机过程及其应用.第三版.北京:高等教育出版社,2004,48~80.
5 MarKov Chains with Stationary Transition robabilities, 1960, 5~12.
6 “An Example of Statistical Analysis of the Text of Eugene Onegin Illustrating the Association of Trials into a Chain,” Bulletin de I’Acadamie Imperiale des Sciences de ,1913,6:153~162.
7 陆大全.随机过程及其应用.北京:清华大学出版社,2002.
8 冯虹,邹华,魏文元.马尔可夫链在教学质量评价中的应用,天津师大学报(自然版),1999,19(1):5~9.
9 楼世博.模糊数学.北京:科学出版社,1985,85~130.
10 胡迪鹤.随机过程论——基础理论及应用.武汉:武汉大学出版社,2001.
11 贺国侠.马尔可夫链方法在体育专业教学质量评价中的应用.西安体育学院学报,1999,16:30~32.
12 梁方楚.教学质量评价的马尔可夫链法.宁波教育学院学报, 2000,2:30~32.
13 杨茂祥,李国兴.教学质量评估的数学模型.西北轻工业学院学报, 1996,4:107~112.
展开阅读全文