收藏 分销(赏)

同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生.pdf

上传人:自信****多点 文档编号:715084 上传时间:2024-02-20 格式:PDF 页数:10 大小:1,008.54KB
下载 相关 举报
同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生.pdf_第1页
第1页 / 共10页
同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生.pdf_第2页
第2页 / 共10页
同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、作者简介:李适源,男,北京大学光华管理学院社会研究中心,博士候选人,研究方向:教育与青少年发展、主观态度与社会分层、社会科学量化方法。致谢:作者在此感谢谢宇教授、柳皑然副教授为本研究提供的指导性建议,感谢匿名审稿人提供的宝贵修改意见。文责自负。本研究提到的心理健康主要是指“情绪健康”(emotional well-being)。同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生?李适源(北京大学 光华管理学院,北京 100871)摘 要:本文基于中国教育追踪调查(CEPS)的两期数据,考察班级同辈补习参与对青少年个体情绪健康和学业表现带来的因果效应。在实证方法上,本文用“双重筛选的套索

2、回归”等机器学习的方法来减少模型设定偏误,以更加稳健地估计出同辈补习的外部性。研究发现:其一,同辈补习参与对青少年具有情绪健康和学业成绩的双重威胁。伴随班级内同辈补习率的上升,个体的负向情绪将会显著增加,百分位成绩将显著下降。其二,同辈的补习参与通过“情绪传染”和“行为模仿”两条渠道影响青少年的情绪健康。其三,同辈补习率对个体教育结果的双重威胁,不会因个体自身加入或退出补习而得到明显缓解。本研究的现实意涵是,“双减”政策不仅意在实现青少年个体层面的教育减负,而且还可通过对青少年同辈群体的减负,进而为个体减负发挥“乘数效应”。关键词:课外补习;同辈效应;套索回归中图分类号:F08;G40-054

3、文献标识码:A文章编号:1003-4870(2023)04-0072-10一、研究问题的提出自 2021 年 7 月以来,国家颁布的“双减”政策(减轻义务教育阶段学生作业负担和校外培训负担)正逐步落地。政策强调“全面规范校外培训行为”“不再审批新的面向义务教育阶段的学科类校外培训机构”,要求“着眼学生身心健康,保障学生休息权利”。“双减”政策的推行,表明了国家对于青少年发展的高度重视,决策者希望通过对课外补习的规制以更好地保障青少年的身心健康。由于“双减”政策推行后的微观数据暂且不多,因而目前的相关实证研究主要是考察政策推行之前的课外补习对青少年带来的多方面影响,进而为“双减”政策推行提供参考

4、。回顾有关我国青少年课外补习的实证研究,其核心关注的是课外补习参与对其心理健康与学业成绩这两方面结果的影响。一方面,青少年参加课外补习的核心目标是提升其在校学业成绩,而学业成绩又与升学机会、后续教育获得的数量与质量紧密相连。因此,关注课外补习对学生学业成绩的作用,就是旨在考察课外补习参与是否为补习参与者带来了合意的学业回报;另一方面,课外补习也可能会让青少年付出心理健康代价。而青少年心理健康关涉到“教育人力资本”和“健康人力资本”的积累,这对推动经济社会高质量发展具有关键性作用1-2。因此,同时关注课外补习带来的学业回报与心理健康代价,这有助于更全面地对课外补习的利弊得失做出评估与权衡。基于中

5、国大陆中学生的课外补习的研究发现,参加课外补习并不能如愿地提升参与者的学业成绩,反27倒对学生自身的情绪健康(emotional well-being)带来了显著的不利影响3-4。而基于中国台湾地区中学生的研究显示,青少年在课外补习过程中面临“学业成绩提升”与“情绪健康恶化”的取舍,参加课外补习的学生一定程 度 上 是 在 用 心 理 健 康 代 价 来 换 取 学 业 成 绩提升5-6。遗憾的是,现有关课外补习参与及其效果的研究对“同辈补习参与”的关注尚且不足。既有文献多着眼青少年自身的补习参与,而同辈群体参加课外补习是否以及如何对青少年自身学业和心理发展带来“外部性”,仍值得进一步探索。无

6、论是教育生产函数的理论框架,还是已有实证发现,均显示同辈群体在行为、心理等多个方面对青少年自身的教育结果产生重要影响7-1316。具体而言,有研究发现,同辈补习参与具有“热屋效应”(hot houseeffect)。即,随着班级同辈的补习参与比例上升,班级中的教育竞争氛围也可能增强,在同辈比较的压力驱动下,班内其他学生也可能选择增加学习投入,效仿同辈参加补习14-15。而也有研究发现,优秀的班级同辈对青少年自身的教育结果具有“双重影响”16。一方面,学业表现优异的同辈可能发挥了“近朱者赤”效应,引导其他学生增加学业投入,并带来成绩提升;另一方面,同辈作为青少年的参照群体,优秀同辈也可能构成其他

7、青少年的“压力源”,进而可能使青少年个体在同辈比较过程中生发焦虑、抑郁等负面情绪。虽然现有的有关课外补习和同辈群体的研究均已相当丰富,但是从同辈群体的视角考察课外补习对于个体影响的研究却仍然较为缺乏。目前针对课外补习的实证研究尚未全面考察同辈群体课外补习对于个体所具有的“同辈外部性”。为了弥补上述不足,本研究从同辈研究的视角考察课外补习对于个体的影响,主要探讨以下三个问题:第一,班级同辈的补习参与率是否对青少年个体的情绪健康与学业成绩具有“双重影响”?如果存在,这种双重影响究竟是健康与成绩的得失权衡,还是健康与成绩的双重伤害?第二,班级同辈的补习参与如何影响到青少年的情绪健康?本文尝试对可能的

8、作用渠道进行探索性的中介分析;第三,同辈补习参与对青少年健康和成绩的影响,是否在“补习参与模式”不同的学生之间存在差异?本文尝试对同辈补习的总效应进行组间异质性分析。最后,本文对实证发现做出理论解释。本研究关注的同辈补习与青少年情绪健康的因果关系问题具有鲜活的现实意义。这可以为“双减”政策提供实证依据,以增进政策效力;不仅如此,青少年抑郁、焦虑等情绪健康问题在近年来呈现出了迅猛增长态势17-18,而本文致力于回答青少年情绪健康与教育竞争之间的关联,这回应了改善青少年身心健康的迫切要求。此外,本研究引入了较为前沿的机器学习方法(基于双重筛选的套索回归,Double Selection Lasso

9、),减少模型误设风险,以期实现更稳健的因果效应估计。二、研究设计(一)数据来源与样本界定1.数据来源本文使用中国教育追踪调查(CEPS)的两期数据,包括基线数据(2013-2014)和追访数据(2014-2015)。该调查采取 PPS 抽样,基线调查中抽取了 112 所学校、438 个班级、约 2 万名初中学生作为样本;在第二期调查中成功追访约近 1 万名初一(升初二)的学生。为方便表述,本文称基线调查数据为“基期”(对应符号为t-1),称追访数据为“当期”(对应符号为 t)。2.分析样本本研究的样本选取的是基期(2013-2014 年)的七年级学生,这批学生在 2014 到 2015 年间得

10、到追访。后续分析主要使用追访数据,同时将基期数据中的某些变量作为滞后变量进行统计控制。需要注意,由于本文核心关注班级同辈的补习参与率对于青少年个体的影响,因此将分析样本进一步限定在七年级升八年级时“没有重新分班的”受访学生,以保证基期的滞后变量与当期变量的信息是可比的。在后续分析中用到的所有变量信息均不存在缺失的受访者将进入到研究样本。因此,最终保留的样本量将会小于原始样本量。值得说明的是,本文筛选样本的标准是基于自变量而非因变量,故属于“外生的样本选择”,一般不会对系数估计带来系统性偏误19。(二)变量与测量1.被解释变量本文有两个被解释变量。其一是受访学生在当期的负向情绪得分。CEPS 追

11、访数据中包含 9 项问题以测量学生近期的抑郁、焦虑情绪。选项均为五分定序测量(从不=1,总是=5)。本文测量方式是将应答结果加参考代表性的同伴效应研究8-10,本文将个体的同辈群体定义为所在班级当中的其他同学。37总,再标准化为均值为 0、标准差为 1 的负向情绪得分。该变量得分越高,说明负向情绪越严重。第二个被解释变量是,受访学生当期的“百分位成绩”。CEPS 追访数据记录了学生在 2014-2015 学年秋季学期的期中考试原始成绩(语文、数学、英语)。为保证成绩在个体间的可比性,本文将三科原始成绩加总,然后按总成绩从低到高排列,生成受访学生的总成绩在班级中的百分位数,称百分位成绩。该变量取

12、值从 0到 1,取值越接近 1,说明受访学生当期总成绩在班内排名越靠前。2.解释变量本文的解释变量是班级同辈在当期的补习参与率。测量方式是受访学生所在班级的其他同学中,当期(最近一年)参加了课外辅导班的人数比例。参考既有研究,将补习界定为“普通数学/奥数、语文/作文、英语”辅导班中至少参加了一项。同辈补习率取值从 0 到 1,取值越接近 1,说明班级同辈中补习比例越大。3.基础控制变量控制变量的选取思路依赖于有待识别的因果关系。本文有别于经典的同伴效应研究。经典研究主要关注“内生的同伴效应”,也即个体所在组群平均结果对个体结果的影响。本研究考察的同伴效应更接近“情境效应”(contextual

13、 effects),核心关注个体所在组群所构成的情境特征对于个体结果的影响720。在情境效应的研究框架下,可假定同辈构成的社会情境对于个体结果的影响是单向的(个体层面的结果在短期内可能较难改变社会情境),因此相对不易遭遇反向因果或者联立性偏误的困扰21196-197。尽管本文的因果识别条件相对更宽松,但仍可能面临由“关联效应”引起的“选择偏误”(selection bias)719-20。例如,家境较好、教育投入意愿较高的学生家长更可能为孩子选择师资力量更强的学校和班级,使得具有类似家庭背景的孩子聚集到同一班级,他们的班级同辈参加课外补习的比例相对较高,情绪和成绩也表现出相似性。参考代表性研究

14、,本文尽可能全面地考虑了如下控制变量。主要包括:学生个体特征、学生家庭特征、班级同伴特征、教师特征,学校以及学期固定效应。为避免“后定变量偏误”22,对于那些明显随时间变化的特征,本文都选取在基期测得的变量信息作为控制。本文的基础控制变量具体包括:学生的性别、出生年份、民族、户口类型、自评健康状况(基期);家庭经济条件、父母亲的最高文化程度和职业类型、兄弟姐妹数量、是否与父母同住;家庭所在地类型、社区的安全、卫生与污染状况;学生在六年级时学习语数外的吃力程度,基期的语数外标准化成绩,基期的认知能力标准化得分,基期的内在学习动力、外在学习动力;学生在基期的补习状况、基期的负向情绪得分;个体对班风

15、良好程度的评价(基期),个体对班级同学友好程度的评价(基期);班级其他同学在基期的标准化语数外成绩;班级其他同学在基期的负向情绪水平;班主任对于该班基期成绩水平的评价(处于年级中的何种水平),班级在基期的人数规模,教师在基期对于个体的关注度(班主任批评与表扬频率,主科老师的提问与表扬频率),教师在基期对班内其他同学的平均关注度,班主任的教龄和教学成就。为减少遗漏控制变量非线性项的风险,本文将基础控制变量中的分类变量都转化为对应的二值变量;对于基础控制变量中的连续型变量,本文生成了相应的一次项、二次项,以及两两之间的交互项。这些变量由此构成“候选控制变量集”,本文使用双重筛选的套索回归(DS-L

16、asso),通过交叉验证来筛选出有效控制变量。表 1 展示了被解释变量、解释变量和(部分)控制变量的描述性统计结果。在被解释变量上,青少年当期的负向情绪得分均值接近 0,标准差约为 0.96;青少年当期的百分位成绩均值为 54.5%,标准差约为 0.28;解释变量上,班级同辈当期参加补习的比例达到了34.4%,标准差约为 0.24。(三)实证策略本文设定了如下的标准计量模型,以识别同辈补习对青少年情绪健康、学业表现的因果效应。Yi,t=+D(i)j,t+Xi+s+t+ui,t(1)被解释变量Yi,t代表青少年在当期(第二学年)的情绪健康状况或学业表现。测量方式分别是负向情绪具体问题为,“在过去

17、的七天内,你是否有以下感觉:(1)沮丧;(2)消沉得不能集中精力做事;(3)不快乐;(4)生活没有意思;(5)提不起劲来做事;(6)悲伤难过;(7)紧张;(8)担心过度;(9)预感有不好的事情会发生”。本文参考了班级同辈效应的代表性研究8,控制了学生家庭所在地和社区环境的特征,这有助于排除“由社区层面带来的情境效应”对于识别本文所关注的同辈效应的干扰。由于基础控制变量数量过多,简洁起见,对于某些定序变量只报告了均值(而略去了各类别的分布)。47表 1变量的描述性统计均值/比例标准差被解释变量 当期的负向情绪得分-0.020.955 当期的百分位总成绩0.550.283解释变量 当期的同辈补习参

18、与率0.340.244基础控制变量 学生个体特征及其家庭特征 学生为农村户口=10.580.494 学生的出生年份2000.440.724 学生为男性=10.500.500 学生的基期自评健康(五分类)4.110.884 学生为汉族=10.880.331 与父母同住=10.680.467 兄弟姐妹数量0.710.818 学生家庭所在的地区类型 市/县城的中心城区0.320.468 市/县城的边缘城区0.130.336 市/县城的城乡结合部0.070.255 市/县城区以外的镇0.050.219 农村0.420.494 家所在社区的治安良好程度(四分类)2.770.666 家所在社区的卫生良好程

19、度(四分类)2.790.630 家所在社区的环境保护程度(四分类)3.190.646 家庭经济条件(五分类)2.790.634 家长的最高受教育年数10.653.116 基期的认知能力标准化得分0.300.794 基期的内在学习动力得分0.120.936 基期的外在学习动力得分0.110.945 基期的语文标准化期中成绩71.498.821 基期的数学标准化期中成绩71.389.388 基期的英语标准化期中成绩71.479.218 基期的个体负向情绪得分-0.010.923 学生的班级同辈特征 基期的同辈负向情绪得分0.000.259 基期的同辈英语期中成绩70.192.908 基期的同辈语文

20、期中成绩70.072.699 基期的同辈数学期中成绩70.222.731 对班级同学友好的同意程度3.320.787 对班级氛围良好的同意程度3.200.878 基期的班级人数48.2810.459 学生的班级教师特征 基期主科老师对学生的关注度0.051.040 基期主科老师对同辈的关注度0.030.507 班主任对该班成绩的评价3.240.946 班主任曾获国家级奖励=10.100.303 班主任的教龄18.447.806 注:1.样本量 N=5388;2.描述性统计结果已经过抽样权重调整。的标准化得分、(班内)百分位成绩。D(i)j,t代表当期的同辈补习参与率,即青少年个体所在班级中其他

21、同学中参加课外补习的人数比例;系数是本文关心的因果效应,它衡量了同辈补习参与率对于青少年情绪健康(或学业表现)的影响。Xi是“有待设定”的控制变量集(它包含可观测的青少年个体特征、家长特征、班级同辈特征、教师特征等);s、t分别代表学校和学期固定效应。ui,t是误差项,它包含了所有未观测的且会影响被解释变量的因素。1.因果图与滞后变量问题尽管本文的因果识别条件相对更为宽松,但仍然面临遗漏变量偏误的挑战。具体表现为以下两个问题。第一,“滞后期”的被解释变量与解释变量可能对因果识别带来干扰。为了说明滞后变量在本文因果识别中所处的地位,本文绘制了简化版的因果图,如图 1所示。图 1 简化的因果图例如

22、关注当期同辈补习对个体负向情绪的影响。在一方面,基期的同辈补习状况可能影响到基期的个体补习决策(D(i)j,t-1Di,t-1),基期的个体补习决策又会进一步传递到当期,影响个体当下的补习决策(Di,t-1Di,t),而已有研究发现,个体自身的补习参与会影响本人的情绪健康(Di,tYi,t);此外,基期的同辈补习状况也可能影响基期的个体情绪健康(D(i)j,t-1Yi,t-1),而基期的个体情绪可能传递到当期,作用于当下的个体情绪(Yi,t-1Yi,t)。上述两条因果路径说明,基期的同辈补习参与可以借助基期的个体变量,进而间接作用于当期的被解释变量;而另一方面,基期的同辈补习状况可能传递到当期

23、,影响当期的同辈补习率(D(i)j,t-1D(i)j,t)。用于描述性统计的样本限定条件是当期负向情绪、当期学业成绩(以及所有基础控制变量)取值均未缺失的受访学生,因此样本量与后文回归分析的样本量存在略微差异需要说明,在同一期数据(同一轮调查)当中,不同学校的学生可能是在不同学期接受的调查。因此,本文设置了代表学期的虚拟变量(秋季学期=1,春季学期=0),简称学期固定效应。57这意味着基期的同辈补习状况是典型的混淆因素(confounder)。因果图带给实证策略的提示是,至少需控制滞后期(基期)的个体补习参与、个体负向情绪以及班级同辈的负向情绪,以阻断“后门路径”(backdoor path)

24、。在此基础上,若滞后期的同辈补习参与D(i)j,t-1对于当期的被解释变量(个体负向情绪或成绩)存在直接影响,那么还需进一步将D(i)j,t-1纳入控制。有基于此,本文将采取“滞后变量模型”进行因果识别。2.双重筛选的套索回归:减少模型设定偏误实证分析面临的第二大问题是,由于控制变量选取不当而引发模型设定偏误。回到计量模型(1)式,为得到的一致估计,需施加“条件独立假定”。它包含了两个子假设。其一是基础控制变量集Xi纳入了所有可能的混淆因素(不存在未观测的遗漏变量);其二是研究者正确设定了被解释变量与控制变量的关系21。上述第二个子假设在实证中尚未得到足够重视。经典的同伴效应研究中对控制变量的

25、通常处理是,仅设定连续型控制变量的一次项(或少量对数项与二次项),并将多分类变量进行类别合并后再生成虚拟变量。这可能会增加模型误设的风险。不仅可能会遗漏连续型控制变量的高次项与交互项,而且对离散变量的主观压缩也可能掩盖了重要控制变量的原始信息。换言之,由基础控制变量所构成的高次项、非线性项可能会成为一种特殊的遗漏变量。例如,以个体学业表现作为被解释变量,它与基础控制变量的关系并不一定是线性的。家庭经济条件等因素对其学业成绩的影响很有可能是边际递减的;再如,以个体负向情绪为被解释变量,班级同学友好程度对于个体情绪的影响,可能与班主任老师对个体的关注度存在着交互效应。为了减少模型误设风险,本文借鉴

26、机器学习的前沿方法,使用“双重筛选的套索回归”筛选出有效的控制变量23-25。该方法的运作原理容易理解,它只是在进行 OLS 系数估计前进行了控制变量的筛选工作。双重筛选的步骤是:首先,使用被解释变量Yi,t对候选控制变量集进行套索(Lasso)回归,以“最小化交叉验证误差”为标准,筛选出控制变量子集XS1;然后,使用解释变量D(i)j,t对候选控制变量集进行套索回归,以同样的标准筛选得出控制变量子集XS2;此后将上述两个筛选出的控制变量子集合并起来,即可得到有效的控制变量集XS=XS1XS2;最后,使用被解释变量对解释变量、筛选出的有效控制变量做 OLS 回归,得到对系数的估计。基于 DS-

27、Lasso 的估计方法具有如下优势。DS-Lasso 估计量具有相当程度的稳健性。它分别筛选出与被解释变量、解释变量具有重要关联的控制变量,再将筛选出的这两组控制变量合并加以控制。这样的“双保险”机制降低了关键控制变量被漏选的风险26。其二,DS-Lasso 估计量的渐进性质已有严格证明。在满足“条件独立假定”和稀疏性假定的条件下,DS-Lasso估计量是一致的、渐进正态的,置信区间是一致有效的23。其三,在有限样本(finite sample)情形下,DS-Lasso 方法相较传统估计方法具有更优良的表现。随机模拟研究显示,如果真实模型当中的被解释变量与控制变量存在非线性关系,那么 DS-L

28、asso(相较一般套索回归或只包含控制变量线性项的 OLS 回归)能有效减少由模型误设导致的系数估计偏误23-24。值得注意的是,本研究在进行 DS-Lasso 估计时,采取交叉验证的方式来进行变量筛选。这可理解为旨在最小化“样本外的预测误差”,进而使被解释变量与筛选出的控制变量的关系尽可能地接近未知的真实模型。这是 DS-Lasso 能有效减少模型误设偏误的关键原因。Chernozhukov 等(2015)对比了以交叉验证为筛选标准的 DS-Lasso 与基于 P 值筛选变量的逐步回归,随机模拟结果显示 DS-Lasso 的“中位值偏差”(medianbias)仅为逐步回归估计偏差的四分之一

29、左右24。DS-Lasso 在社会科学实证研究的应用日益见长。Belloni 等(2014)重新评估了人工流产可及性对美国各州犯罪率的因果效应,发现 DS-Lasso 估计结果相比传统方法更为稳健23。在教育经济学研究中,已有少数研究使用 DS-Lasso 捕捉教育结果与诸多控制变量间的非线性关系,例如彭树宏(2022)用 DS-Lasso 方法重新评估了教育的健康回报27。在此基础上,本研究也希望为补习效果评估和同辈效应研究提供方法论启发。三、研究发现本章主要回答以下三个问题:其一,同辈补习对个体情绪健康和学业表现是否具有双重威胁。这对应于总效应的估计;其二,同辈补习对个体情绪的负面影响为何

30、存在。这对应于中介机制的探索性分析;其三,同辈补习对哪类青少年带来的冲击最大。这对应于异质性分析。最后对实证发现做出理论解释。也即,真实模型中的控制变量个数在量级上应小于样本量的量级。67 (一)总效应分析:同辈补习对情绪健康与成绩排名的双重威胁首先,使用 DS-Lasso 估计同辈的补习参与率对青少年负向情绪的因果效应。结果如表 2 前两列系数所示。同辈补习率对应系数在 p0.01 水平上显著为正。伴随同辈补习率上升,青少年个体的负向情绪得分也会显著增加,效应量在 0.4 到 0.5 左右,说明同辈补习将会对青少年情绪健康带来显著负面影响。表 2同辈补习参与对青少年负向情绪的影响:DS-La

31、sso 和 OLS 估计被解释变量:(当期)负向情绪得分(1)DS-Lasso(2)DS-Lasso(3)OLS(4)OLS同辈的补习参与率0.426*0.513*0.390*0.527*(0.124)(0.168)(0.125)(0.176)个体在基期参加补习0.0390.0390.0390.039基期的同辈补习率-0.138-0.218始终纳入控制的变量 学校 FE+学期 FEYESYESYESYES 所有基础控制变量YESYES 筛选出的非线性项YESYES筛选出来的其他变量YESYES判定系数 R20.2640.2640.2680.268样本数 N5423542354235423 注:

32、1.前两列系数是 DS-Lasso 的模型估计结果。学校和学期效应始终纳入控制,筛选前的控制变量总数为 405 个(含学校和学期固定效应),筛选后进入最终回归方程的控制变量数为 157个(含固定效应)。2.后两列是基于 OLS 的估计结果。模型中纳入了所有的基础控制变量,也加入了 Lasso 筛选出的非线性项(基础控制变量的二次项、交互项)。3.括号内是以班级聚类的稳健标准误。*p0.1,*p0.05,*p0.01。估计策略上,用于 DS-Lasso 筛选的变量(候选变量)包括基础控制变量中的分类变量(均为二值变量)、连续变量的一次项、二次项以及两两间交互项。学校和学期效应始终纳入控制(不参与

33、筛选)。有趣的是,筛选出的控制变量几乎包含了所有基础控制变量。但其中很大部分是控制变量间的交互项,说明被解释变量与基础控制变量的真实关系可能是非线性的。稳健起见,本文也进行了 OLS 估计。回归方程中纳入所有基础控制变量的线性项以及 DS-Lasso 选出的非线性项。结果如表 2 后两列系数所示。同辈补习率对应的 OLS 估计值和 DS-Lasso 估计值相当接近,标准误略微变大。这在一定程度上印证了 DS-Lasso 估计结果的稳健性。接下来,使用 DS-Lasso 估计同辈补习率对于青少年当期百分位成绩的因果效应。结果如表 3 前两列系数所示。同辈补习率的对应系数在 p0.01 水平上显著

34、为负。伴随同辈补习参与率的上升,青少年的百分位成绩将会显著下降,效应量约为 6 到 9 个百分点。表3 后两列报告了 OLS 的系数估计结果。模型设定与表2 类似,纳入了所有基础控制变量和 DS-Lasso 筛选出的非线性项。对比发现,OLS 可能高估了同辈补习参与率对青少年百分位成绩的负面影响。表 3同辈补习参与对青少年百分位成绩的影响:DS-Lasso 和 OLS 估计被解释变量:(当期的)百分位成绩(1)DS-Lasso(2)DS-Lasso(3)OLS(4)OLS同辈的补习参与率-0.083*-0.060*-0.091*-0.073*(0.019)(0.023)(0.022)(0.02

35、7)个体在基期参加补习-0.010-0.010-0.008-0.008基期的同辈补习率-0.032-0.028始终纳入控制的变量学校 FE+学期 FEYESYESYESYES所有基础控制变量YESYES筛选出的非线性项YESYES筛选出来的其他变量YESYES判定系数 R20.6640.6640.6720.672样本数 N5491549154915491 注:1.前两列是 DS-Lasso 的模型估计结果。学校和学期固定效应始终纳入控制(不参与变量筛选),筛选前的控制变量总数为 405 个(含学校和学期固定效应),筛选后进入最终回归方程的控制变量数为 151 个(含固定效应)。2.其他,同表

36、2 注。需注意,本文对同辈补习率的测量方式意味着,同辈补习比例在班内不同学生、不同班级间都可能存在差异。因此,同辈的补习参与率作为情境变量,它对于个体百分位成绩的影响更类似于“跨情境比较”而并不局限在“班内比较”。此处的估计结果应解读为,相比补习参与率较低的同辈情境,身处较高补习参与率的同辈情境中的青少年,其总成绩在班内排位将会相对更加靠后。另外,控制变量中已纳入了学生个体及其同辈在基期的语数外标准化成绩,以保证进行跨情境比较的学生在基线成绩水平上是基本相同的。总的来看,同辈补习参与率升高,不仅可能导致身稳健起见,以班级为单位生成了受访学生的“标准化总成绩”,考察了同辈补习参与对标准化成绩的影

37、响。结果保持一致。77处同辈情境中的青少年情绪健康变差,还可能导致青少年自身的成绩排位下降。也即,同辈的补习参与对于青少年个体的情绪健康和学业成绩表现出了“双重威胁”的特性。(二)中介效应的初步分析:同辈补习如何影响情绪健康?本节尝试回答,同辈补习率的提高为什么会增加青少年自身的负向情绪。本文提出了两条可能的中介路径。第一是“情绪传染机制”。该机制将两支文献连结起来。一方面,个体自身参加课外补习将有可能增加负向情绪4-6;另一方面,同辈群体的负向情绪可能通过班级社会网络传染给学生个体8。据此推断,青少年的同辈参加补习可能会使同辈的负向情绪增加,而同辈的负向情绪又将会通过班级社会网络传染给学生个

38、体。这对应本文因果图中的下三角路径:D(i)j,tY(i)j,tYi,t;第二是“行为模仿机制”。有研究发现个体倾向遵从其同辈群体内的社会规范,在学业相关的行为表现上会对同伴行为进行观察和效仿9-10。据此推断,青少年观察到同辈补习率的增加,自身可能效仿同辈行为,参加补习或者增加补习投入。进而,课外补习参与(尤其是高强度长时间的补习)可能增加青少年个体的负向情绪。这对应于因果路径图中的上三角路径:D(i)j,tDi,tYi,t。我们可以使用标准的乘积法来识别中介效应28-29,但在具体估计中将会面临“标准同伴效应”的识别难题。就“情绪传染机制”而言,需要估计出解释变量对中介变量的效应,以及中介

39、变量对于被解释变量的效应。注意到,这里中介变量(班级其他同学的平均情绪)对被解释变量(个体自身情绪的影响)的影响,属于标准的同伴效应。在一个班级当中,所有学生的负向情绪得分之和是一个给定的常数。由于这种特殊共线性的存在,若直接用某班级的个体自身情绪得分对该班其他同学的平均情绪得分进行简单回归,将可能得到虚假的相关关系。类似地,在“行为模仿机制”中,解释变量(班级其他同学的平均补课率)对于中介变量(个体自身补习参与)的影响也属于标准的同伴效应。本文分别采取以下两种策略来化解上述的识别难题。第一,针对“情绪传染机制”,已有代表性研究提供了可行的工具变量 班级中其他同学的母亲与其孩子谈心的比例,以此

40、估计同辈负向情绪对个体自身情绪的因果效应8。由此,本文也基于同辈母亲与其孩子谈心的状况来构造工具变量,从而估计出中介变量(同辈负向情绪)对被解释变量(个体负向情绪)的影响。第二,对于“行为模仿机制”,由于暂时缺乏有效工具变量的借鉴,因此本文改变分析思路,将中介变量替换为“个体自身参加课外补习的时长”,避免中介变量与解释变量由于构造而导致的共线性问题。需要注意的是,上述思路并不必然满足中介效应的识别条件,也并不保证可以获得对中介效应的无偏估计。因此,这部分的分析仅为探索性尝试,结果需谨慎看待。按照上述思路,表 4 报告了两条作用渠道所对应的中介效应估计结果。基于一类错误概率最小的逐步检验显示,情

41、绪传染机制、行为模仿机制所对应的中介效应均在 p0.05 水平上显著为正。其中,情绪传染机制对总效应的解释比例约为 32%,行为效仿机制对总效应的解释比例约为 11%。表 4基于乘积法的中介效应估计结果同辈负向情绪(M1)个体负向情绪(Y)个体补习时长(M2)个体负向情绪(Y)同辈补习参与率0.218*0.289*0.817*0.350*(0.091)(0.112)(0.192)(0.124)同辈负向情绪0.632*(M1)(0.232)个体补习时长0.052*(M2)(0.012)其他控制变量YESYESYESYES 注:括号内是以班级聚类的稳健标准误。*p0.1,*p0.05,*p0.01

42、。本节对中介机制展开的探索性分析结果表明,同辈补习参与可能借助“负向情绪传染”和“补习行为模仿”两条渠道来影响青少年的情绪健康。需要说明的是,由于数据观测期数的限制,以及对内生性问题的考虑,本文并未探讨同辈补习参与影响个体成绩的中介机制。这或是后续研究的进路所在。(三)异质性分析:同辈补习使谁受损最大?上述分析主要关注的是同辈补习对个体教育结果的总体平均效应。已有研究发现,个体参加课外补习的因果效应,在补习参与模式不同的学生群体具有组间构造方式是将学生报告的周中和周末参加课外辅导班的小时数取平均(未参加补习者取值为 0)。该变量的原始测量结果是多分类的时长区间,本文取每个区间的中位值,将之转化

43、为连续变量。转化后的变量可能存在一定程度的测量误差。这也是本文未将补习时长作为主要解释变量的原因。稳健起见,也使用了“做差法”和结构方程模型来估计中介效应系数。估计值和标准误和表 4 很接近。87异质性6。本文借鉴代表性研究的分组思路,按受访学生在基期和当期是否参加课外补习,划分出四类学生:总是补习者(两期都补习)、从不补习者(两期都没参加补习)、后期加入者(只在当期参加补习)、后期退出者(只在基期参加补习)。本文将这四类学生转化为三个虚拟变量(以“从不补习者”为基准组),分别生成同辈补习率与这三个虚拟变量的交互项,然后将这三个虚拟变量以及它们与同辈补习率的交互项放入回归方程,控制变量与总效应

44、分析中纳入的控制变量保持一致,最终得到同辈补习率对每类学生的情绪健康、学业表现的效应系数。表 5 报告了异质性分析结果。表 5 中的系数是基于交互项系数和主效应系数计算出的“组内效应”。重要发现是,同辈补习率对“总是补习者”情绪健康带来的负面影响几乎达到“从不补习者”的两倍;同时,同辈补习率对“总是补习者”百分位成绩的负面影响也几乎是“从不补习者”的两倍。表 5同辈补习对不同类型学生的负向情绪、学业表现的组内效应(1)负向情绪得分(2)百分位成绩(3)负向情绪得分(4)百分位成绩A.总是补习者0.540*-0.102*0.661*-0.082*(0.143)(0.022)(0.190)(0.0

45、27)B.从不补习者0.255-0.058*0.358*-0.041(0.167)(0.029)(0.192)(0.029)C.中途加入者0.455*-0.096*0.571*-0.077*(0.186)(0.042)(0.217)(0.043)D.中途退出者0.477*-0.075*0.590*-0.056(0.178)(0.037)(0.204)(0.039)基期的同辈补习率YESYES控制变量YESYESYESYES样本数 N5423549154235491 注:括号内是以班级聚类的稳健标准误。*p0.1,*p0.05,*p0.1);说明同辈补习参与对青少年情绪健康、百分位成绩带来的负面

46、影响,可能不明显依赖于个体自身的补习决策。尤其在情绪健康维度上,除了“从不补习者”以外的其他三组学生,同辈群体的补习参与率对青少年个体的情绪健康都表现出显著的负面影响(p0.05)。更进一步,可使用上节探讨的作用渠道来解释同辈补习对“后期加入者”和“后期退出者”情绪健康的影响机制。一方面,即使青少年退出了课外补习,仍然可能受到班级同辈负向情绪的传染;另一方面,即使青少年选择效仿同辈,当期参加补习,仍可能会由于补习参与“挤出闲暇时间”“睡眠剥夺”等因素,最终威胁到自身的情绪健康4-6。四、结论与讨论伴随“双减”政策推行,科学评估课外补习参与对青少年发展带来的利与弊,具有迫切的现实意涵。本文基于中

47、国教育追踪调查(CEPS)两期数据,使用因果即使是估计值最小的“从不补习者”,(某些情形下)同辈补习对其情绪和成绩也表现出显著负面影响。97图来刻画同辈补习参与对青少年个体教育结果的因果机制,引入“基于双重筛选的套索回归”以减少模型误设的风险,最终得到对于同辈补习效应的稳健估计。主要结论如下。第一,同辈补习参与对青少年的教育结果可能构成“双重威胁”。班级同辈补课参与率的提升,将会显著增加青少年个体的负向情绪,同时也会带来青少年的百分位成绩显著下降。该结论在控制了基期的补习参与状况后仍然保持稳健。第二,同辈补习参与可能通过“情绪传染”“行为效仿”这两条渠道作用于青少年个体的情绪健康。基于标准的中

48、介分析方法,发现这两条机制对总效应的解释比例分别达到 32%和 11%左右,且中介效应均在 p0.05上显著。第三,本文按照“补习参与的模式”划分出四类学生群体,发现班级同辈对“总是参与者”(两期均参加补习的学生)带来的负面影响最强。进一步考察“总是参与者”的学生特征,本文推断这群青少年观察到同辈补习投入增加后,更易感知到同辈比较的压力与被赶超的焦虑;而情绪健康恶化又可能进一步扰乱自身的正常学习轨迹,最终促成了某种意义上的“自证预言”。本文在概念框架上将“课外补习研究”与“同辈效应研究”两支文献建立了连结。在既有的补习效果评估或同辈效应研究中,大多发现参加课外补习(或优秀同辈的学业表现)对青少

49、年个体带来的影响,在健康之“失”和成绩之“得”两个维度上存在着权衡关系5-610。本文从同辈效应的视角考察课外补习的后果,发现同辈的补习参与带给青少年的“(情绪)健康外部性”和“成绩外部性”更接近双重威胁,而非“得失替代”的关系。面对高度竞争性的同辈情境,青少年增加自身教育投入,对学业成绩的提升作用可能相对有限,却更易在同辈压力与社会比较的裹挟下,陷入被赶超的焦虑或遭遇相对剥夺的抑郁情绪。近年来中国社会掀起的课外补习热,可视作基础教育阶段“内卷化”的鲜活写照32。在这场浪潮中,青少年与其同辈(以及家长)可能都在不断增加教育卷入,而过度竞争的同辈环境却可能削弱了青少年学习投入的预期效果,使其非但

50、不能如愿提升成绩,反而陷入负向情绪的泥沼。无效竞争的结局,可能是青少年在健康与学业上的“双输”。由此观之,“双减”政策的意义不仅在于个体层面的教育减负,而且还可通过对青少年同辈群体的减负,进而为个体减负发挥“乘数效应”。这也提示在“双减”政策落地过程中,需格外注重施政公平性和覆盖范围的普遍性,以增进政策效力。最后说明研究局限。其一,对同辈补习效应的识别依赖于“条件独立假定”。如果存在未能观测的混淆因素,将可能给因果效应带来估计偏误。其二,本文的中介变量可能无法严格满足“序贯独立假定”,机制分析的结论只具有探索性的参考意义。其三,由于观测时期数限制和可能的内生性问题,本文未能探讨同辈补习参与影响

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服