ImageVerifierCode 换一换
格式:PDF , 页数:74 ,大小:4.12MB ,
资源ID:1244864      下载积分:25 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/1244864.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(2023中国股票风险因子模型白皮书.pdf)为本站上传会员【Stan****Shan】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

2023中国股票风险因子模型白皮书.pdf

1、中国股票风险因子模型白皮书中国股票风险因子模型白皮书第 1 页 共 73 页中中国国股股票票风风险险因因子子模模型型清华大学全球证券研究院摘要:摘要:近年来,基于因子体系的建模方法在宏观经济及多种资产大类(股票、信用债、大宗商品、外汇、利率以及衍生品)受到了各国学者的重视。该领域的研究也取得了长足的进步和丰厚的成果,因子体系逐渐成为当前头部金融机构精细化管理投资流程,风险控制以及投后归因的主流工具。为助力国内金融基础设施建设,我们对我国的金融市场进行了实证研究,改良了传统因子体系构建方法。本文旨在探索中国股票风险因子模型体系的构建,深度结合中国金融市场环境实际,逐步校验并调整因子模型的假设。相

2、比于传统的股票市场因子体系,本文构建的中国股票风险因子模型摈弃了市值加权的回归分析方法,使用更为稳健的换手加权 EM 算法估测,并以此为基础,在申万行业因子之外臻选出 12 个具有强解释力且直观稳定的风格因子。我们使用 2012-2022 年中国 A 股上市公司股票的实际数据,使用模型进行实际风险控制校验,该因子体系相比于传统因子体系在控制波动率以及尾部风险均有显著提升,有助于制定更精准的风险控制与投资决策。关键词关键词:因子模型、EM 算法、风险中国股票风险因子模型白皮书第 2 页 共 73 页1.因子因子的的基本概念基本概念因子(Factor)的概念源于 CAPM 理论,该理论描述了在无交

3、易成本、投资者理性决策的假设下,资产的预期超额收益和市场预期超额收益线性相关的关系。CAPM 模型是最简单的因子模型,其中市场超额收益对应的市场组合称之为“市场因子”。以此为契机,S.A.Ross(1976)提出了著名的套利定价理论(Arbitrage Pricing Theory,APT),进一步扩展定义了包含多个因子的市场一般定价模型。为了进一步介绍因子,本文先介绍更宽泛的概念:特征(特征(Characteristics):任何个股级别的数据都是个股的特征。信号(信号(Signal):能够对收益有预测能力的特征,称之为信号。因子因子(Factor):经过进一步优选的,满足特定要求的信号,称

4、之为因子。因子暴露(因子暴露(Factor Exposure/Factor Loading):它描述个股超额收益对因子组合超额收益的反应。通常在模型中记作。在一个统一的因子模型中,因子暴露与因子之间,存在一一对应的关系。因子模拟投资组合因子模拟投资组合(Factor-Mimicking Portfolio):构建一个动态调仓的投资组合,使这个投资组合的收益模仿/跟随目标因子。在主流的因子分析框架的假设下,因子有两个重要性质:1.因子是个股联动的重要因素;2.个股的期望收益及当期收益,完全由因子的预期收益及当期收益贡献。1具体来说,APT 认为:,+1=,+1(1.1)其中,表示期望算子,,+1

5、代表因子收益(K1),,+1代表个股收益(N 1),代表因子暴露(NK)。和 CAPM 类似,多因子模型假设资产的预期收益率由公式(1.1)右侧的一系列因子的预期收益率和资产在这些因子上的暴露决定。然而,金融市场本身非常复杂,其中包含大量的仅依靠当前已经列出的因子所1基于 APT 框架(S.A.Ross,1976),个股收益和因子之间线性相关,任何没有共同因子暴露的个股的收益都会相互独立。值得注意的是,因子未必有很高的预期收益,甚至预期收益未必是正的。中国股票风险因子模型白皮书第 3 页 共 73 页无法捕捉到的随机变动,这种问题当然可以通过寻找更多的因子来捕捉更多的变动性,但这种方法仍然不可

6、能完全捕捉到金融市场的所有变动性,金融市场上的完全无理由的噪声是普遍存在的,因此实际市场模型,可以通过引入一个定价误差(pricing error)项来描述。因此,(1.1)式通常也可被具体写作:,+1=,+1+,+1+.+1(1.2)其中,+1为资产的实际预期收益率和多因子模型隐含的预期收益率之间的定价误差,,+1代表个股特异性收益(N 1)。如果,+1显著偏离零,则代表了某个可以通过套利而获得超额收益的机会;这也同时说明由于某些原因,市场对该资产出现错误定价(mispricing),从而导致其实际预期收益率和多因子模型下的预期收益率出现了偏离。2根据风险和收益,我们可以将因子粗略地分为两类

7、:(1)风险因子:因子风险高,收益低。(2)Alpha 因子:因子风险低,收益高。指数化投资重点强调投资组合对于不同风险因子的敏感程度,而水平一般为主动型投资组合所重点考量。2.风险模型的意义风险模型的意义金融业务的关键难点在于风险决策。如何系统行的度量与处置风险,进而做出优秀的风险决策,是金融行业面临的核心挑战。在科学的风险建模方法中,因子法是当前国际金融市场上普遍采用的系统性解决方案,因子法建模,具有清晰明了、简洁灵活、容易扩展的特征,在国内、国际金融市场的研究和实践中都有着广泛的应用。基于因子的投资分析与建模框架,被学术界与业界统一采用。经过几十年的努力,学术界提交了丰富的金融理论模型和

8、计量经济统计工具来计算资产的价值,并发现了广泛接受和接受的价值、盈利能力、动量和低波动性要素。自股权投资基金出现至今,这些学术成果一直为业界2这个系统里t并不是必要的,因为t可以被视为是一个风险极低收益极高的特殊因子 ft0中国股票风险因子模型白皮书第 4 页 共 73 页所应用。事实上,因子投资的兴起得益于资产定价的学术研究。同时业界的因子投资活动也为已有理论的反复检验和新理论的提出提供了充足的数据,促使学术界不断提出新的研究成果。这个过程中,因子模型本身,也在不断改进和创新。多因子模型作为替代 CAPM 的主流替代方法之一,已逐渐发展成为股权投资的有效手段。当前国际金融市场上大量的资产管理

9、机构都在使用风险因子模型来管理他们资产组合,同时也培育了以 MSCI3,Axioma4,Northfield5,SunGard6等为代表的第三方通用风险因子模型体系的商业模式。到目前为止,多因子模型一直应用于各种类型的资产投资中,特别是在股票、债券、商品期货和加密货币领域中有所体现。最新趋势从因子的角度分析了各种类型资产收入的潜在驱动因素和逻辑,并将要素用于类别之间的资产构成。对于因子投资主体来说,了解现有方法有助于更好地适应和接受因子投资的未来发展和变化。3.现有现有风险风险因子因子模型介绍模型介绍与解释并预测资产收益的收益率模型不同,在因子投资中,风险模型的主要目标是准确预测资产收益的协方

10、差矩阵,为风险控制提供依据。在风险模型中,因子的个数往往远小于资产的个数,因此能达到降维的效果。根据风险模型,我们可以得到资产协方差矩阵与因子协方差矩阵的关系:=+(3.1)其中,为资产的协方差矩阵(N 阶),为因子协方差矩阵(N3MSCI 公司,一家总部位于美国纽约的知名金融公司,提供多样化的市场投资指数服务以及专业化的多资产组合分析工具是其重要的服务模式。2004 年,MSCI 公司收购了 Barra 公司并成立了 MSCI Barra,专业提供资产因子模型体系服务,随后 2010 年,MSCI 公司进一步收购了 RiskMetrics 公司,进一步丰富了其在多资产的收益、风险建模方面的专

11、业化工具体系。4Axioma 公司总部同样位于纽约,1998 年成立,是一家专业从事投资组合优化决策的软件服务商,投资组合经理们使用相关工具由于组合生成、组合监控、虚拟持仓模拟与风险评估,管理交易成本和持仓再平衡,作为其分析、模拟与决策的基础,Axioma 构建了相当全面的风险因子体系。5Northfield 公司成立于 1985 年,专业致力于面向资产管理的风险预测业务,其对于短期、中期、长期的风险评估,引入不同的数据源,采用不同的风险建模方式,从而形成一套覆盖相对完整的风险评估体系。6SunGard 公司,总部位于美国宾夕法尼亚,最初是一家从事数据服务的软件公司,1997年收购了交易与风险

12、管理软件设计商 Infinity Financial Technology,进军风险管理与分析业务,并通过后续的一系列收购,构建起强大的数据服务、风险分析、资产管理的能力。中国股票风险因子模型白皮书第 5 页 共 73 页阶),为随机误差矩阵(N 阶),由于资产收益率中的随机误差相互独立,为对角矩阵。=1,2,,为因子暴露矩阵(NK)。在海外,有很多应用于计算资产协方差矩阵并进行风险控制的多因子风险模型。第三节中,我们从市场常用模型中选取最新一版刻画中国 A股股市的 CNE6(CNLT)模型作为例子,详细介绍风险模型的搭建和求解方法,意在使读者更好地理解风险模型,体会风险模型计算协方差矩阵的优

13、点及其对风险控制的重要意义。3.1 市场常用市场常用模型估计方法模型估计方法基于求解股票协方差矩阵的目标,根据式(3.1),我们需要估计三个参数:、和。估计过程主要分为两步:第一步,计算因子暴露矩阵。第二步,通过回归得到因子收益率序列。第三步,在第二步的基础上计算和。3.1.1 计算因子暴露矩阵计算因子暴露矩阵首先,我们回顾经典的 Fama-MacBeth 截面回归方法:1.时序回归(N 次):在时刻 t,对每个资产 i 的历史时序数据,分别进行时序回归,估计资产 i 在所有因子上的暴露?。2.截面回归(T 次):用?作为自变量,资产超额收益率,+1作为因变量,对每个时刻 t 进行截面回归,得

14、到各因子收益率时序?,+1。进一步即可计算和。对于因子暴露矩阵的求解,传统做法是通过 N 个时间序列回归,得到每个资产 i 在全部因子上的暴露?,这也是 Fama-MacBeth 两步回归中第一步所采用的做法。然而,?作为生成的回归变量本身就带有一定误差,将其作为第二步回归的自变量,会产生计量经济学中的变量误差(errors in variables,EIV)问题。因此,为了规避上述问题,对于风格因子,市场常用多因子模型直中国股票风险因子模型白皮书第 6 页 共 73 页接使用公司特征作为风格因子暴露的原始值(如,直接取用 EP 值原始数据),并对之进行标准化处理。这样,对每一个时间点 t,我

15、们可以直接得到因子暴露矩阵:=11111111212212111(3.2)矩阵中,的下标 1N 代表 N 个资产分别对应的因子暴露,上标指代不同因子。各资产对国家因子的暴露均为 1。1对应 P 个行业因子暴露,均为哑变量,每个资产 i 有且仅有一个=1。1对应 Q个风格因子暴露,由公司特征原始值经过标准化得到。具体而言,假设市场组合在任何风格因子上都应该是中性的,那么市场组合对各因子的暴露为零。因此,先对各因子暴露减去市值加权平均值,使之满足:=1?=0,=1,(3.3)表示资产 i 的市值权重。再对各风格因子暴露分别除以其标准差,风格因子暴露的标准化就完成了。3.1.2 计算计算因子收益率序

16、列因子收益率序列根据 Menchero and Lee(2015)的方法,我们进行多次横截面回归,得出因子收益率序列。截面回归模型如下:,+1=,+1+,+1(3.4)其中,为 t 时刻下的因子暴露矩阵(NK)7:=11111111212212111(3.5),+1为t到t+1时段N支股票(相对无风险收益率)的超额收益(N1);73.1.1 给出了矩阵的具体计算方法,此处不再赘述。中国股票风险因子模型白皮书第 7 页 共 73 页,+1为 t 到 t+1 时段各因子收益率(K1);,+1为 t 到 t+1 时段 N 支股票的特质性收益率(N1)。为了简便,下文省略时间下标 t 与 t+1。由于

17、国家因子暴露和 P 个行业的因子暴露之间存在共线性,造成(3.4)解不唯一,因此对行业因子给定限制:11+22+=0(3.6)其中,为 t 到 t+1 时段行业因子收益率,为 t 时刻行业内所有股票按市值加权算出的权重之和。根据约束条件(3.6)可以构造约束矩阵 C(Ruud 2000):C11=100000010000012100000010000001C111+00000(3.7)式(3.7)等号右边的矩阵即为 K(K-1)阶约束矩阵 C。对于(3.4),使用 WLS 估计。在市场常用模型中,假设个股特质性收益率的方差与个股市值成反比,即 1,其中 ME 代表流通市值。基于这个假设,令=1

18、,构造如下权重矩阵 W:=10002000(3.8)有了 W 以及 C 之后,我们利用带约束条件的最小二乘法求解(3.4)t 到 t+1 时段下的因子收益率?。令C111=,C11=,则(3.7)可重写为中国股票风险因子模型白皮书第 8 页 共 73 页=(3.9)根据加权最小二乘法(WLS),我们需求解min1 12(3.10)将(3.9)代入(3.10),得到min1 12(3.11)式(3.11)对求一阶导,令一阶导等于 0,解得?=(2)12(3.12)将(3.9)代入(3.12)得?=(2)12(3.13)对于给定的时间窗口t-k/2,t+k/2),可以通过 k 次截面回归求解出每个

19、时刻下各因子收益率,得到各因子的收益率时间序列。3.1.3 计算计算协方差矩阵协方差矩阵和和通过 3.1.2,我们得到各因子的收益率时间序列。进一步,根据(3.4)将每个时刻的?代入回归模型,我们可以得到每个时刻下个股的特质性收益率:?,+1=,+1?,+1(3.14)将每个时刻下个股的特质性收益率序列组合成 N 支个股的特质性收益率时间序列,我们便得到因子收益率时序与特质性收益率时序。进而,我们可以估计出因子收益率的样本协方差矩阵?和个股特质性收益率协方差矩阵?。实证经验表明,上述对协方差矩阵的简单估计并不准确。因此,我们还需要通过一些统计手段对之进行调整。对?主要使用特征因子调整法进行调整

20、。首先,对?进行特征分解,分解得到对角矩阵?与特征向量矩阵。其中,对角矩阵?的对角元素表示特征因子组合的方差。8实证表明,特征因子组合的方差估计并不准8特征因子组合是以分解得到的每个特征向量作为权重,将因子组合看作单个资产,加权中国股票风险因子模型白皮书第 9 页 共 73 页确,估计的特征因子组合收益率方差越小,事后检验就越偏离真实值。因此,我们利用自助抽样法(bootstrap)再取样,得到再取样的对角矩阵?与?之间的偏差,以此来近似?与未知的真实对角矩阵之间的偏差,并以此估计偏差作为修正系数对?进行修正。而对于?,研究表明,基于历史数据的估计也并不准确。样本特质性波动率低的股票波动性被低

21、估,样本特质性波动率高的股票波动性被高估。因此,可以采用贝叶斯收缩法进行调整。其具体做法是将全部股票按市值大小分为十组,计算每组市值加权的平均特质性波动率,并将此平均波动率作为各组股票的“先验”。调整后的个股特质性波动率等于“先验”的平均波动率与个股特质性波动率的加权平均。经此调整,样本特质性波动率向先验数据“收缩”,样本估计稳定性增强。经上述调整,协方差矩阵的估计值更接近实际值,模型估计风险的准确性进一步提高。将与调整后的和代入(3.1),可求得个股收益率协方差矩阵的估计值。3.2 因子介绍因子介绍CNE6(CNLT)模型中包含了 1 个国家因子、16 个风格因子以及32 个行业因子9。其中

22、,风格因子可归为 8 类:规模因子(Size)、波动率因子(Volatility)、流动性因子(Liquidity)、价值因子(Value)、质量因子(Quality)、动量因子(Momentum)、成长因子(Growth)、分红因子(Dividend Yield)。3.2.1 规模因子规模因子(Size)规模因子(Size)由市值(LNCAP)和中等市值(MIDCAP)组成。市值:股票市值的自然对数。中等市值:代表股票的非线性市值。对市值因子求立方,并以回归权重将其对市值因子正交化,最后进行缩尾和标准化处理。配置得到的资产组合。9行业依据全球工业分类标准(GICS)划分。中国股票风险因子模型

23、白皮书第 10 页 共 73 页3.2.2 波动率因子波动率因子(Volatility)波动率因子(Volatility)由 Beta 因子(HBETA)和残余波动率(Residual Volatility)构成。Beta 因子:代表无法被市场因子所解释的市场风险。以 252 天为半衰期,在最近 504 个交易日窗口内,将股票收益率(减去无风险收益)对全样本市值加权收益率(减去无风险收益)进行时序回归,取回归系数作为 Beta 因子。10残余波动率(Residual Volatility):由历史 Sigma(HSIGMA)、日超额收益标准差(DASTD)、累积收益范围(CMRA)三个因子构成

24、。历史 Sigma:以计算 Beta 因子的方法进行相同回归,计算残余收益的波动率。日标准差:以 42 天为半衰期,计算过去 252 个交易日的超额收益波动率。累积收益范围:过去 12 个月累积对数超额收益的最高值与最低值之差。3.2.3 流动性因子流动性因子(Liquidity)流动性因子(Liquidity)由月换手率(STOM)、季换手率(STOQ)、年换手率(STOA)和年化交易量比率(ATVR)构成。月换手率:最近 1 个月交易股票百分比的对数。季换手率:最近 3 个月月交易股票平均百分比的对数。年换手率:最近 12 个月月交易股票平均百分比的对数。年化交易量比率:以 63 天为半衰

25、期,最近 252 天窗口内,日交易股票百分比的指数加权和。10为了减少非同步性和自相关性的影响,收益率以 4 天为单位采取聚合处理。中国股票风险因子模型白皮书第 11 页 共 73 页3.2.4 价价值因子(值因子(Value)价值因子由账面市值比(BTOP)、盈利率(Earnings Yield)和长期反转(Long Term Reversal)构成。账面市值比(BTOP):最新报告普通股账面价值/现市值盈利率(Earnings Yield)由现金盈利价格比(CETOP)、EP 比(ETOP)、企业倍数(EM)、分析师预测 EP 比(ETOPF)构成。现金盈利价格比:过去 12 个月现金利润

26、/现市值EP 比:过去 12 个月利润/现市值企业倍数:上一财年息税前利润(EBIT)/现企业价值(EV)分析师预测 EP 比:未来 12 个月预测利润/现市值长期反转(Long Term Reversal):由长期相对强度(LTRSTR)和长期历史 Alpha(LTHALPHA)构成。长期相对强度:首先以 260 天为半衰期,在过去 1040 天的窗口内,计算股票超市场收益对数的指数加权和,作为非滞后的长期相对强度。接着滞后 273 天,计算 11 天窗口内非滞后值的等权平均值,再取负数,以此作为长期相对强度。长期历史 Alpha:首先,以 260 天为半衰期,在过去 1040 天的窗口内,

27、按与计算 Beta 因子一样的方法(CAPM)取时序回归的截距项,作为非滞后的长期历史 Alpha。接着滞后 273 天,计算 11 天窗口内非滞后值的等权平均值,再取负数,以此作为长期历史 Alpha。3.2.5 质量因子质量因子(Quality)质量因子由杠杆率(Leverage)、盈利变动率(Earnings Variability)、盈利质量(Earnings Quality)、盈利能力(Profitability)、投资能力(Investment Quality)五个二级因子构成。杠杆率(Leverage):由市场杠杆率(MLEV)、账面杠杆率(BLEV)和资产负债率(DTOA)三个

28、三级因子构成。中国股票风险因子模型白皮书第 12 页 共 73 页市场杠杆率:上一交易日普通股市值+上一财年优先股+上一财年长期负债上一交易日普通股市值账面杠杆率:上一财年普通股账面值+优先股账面值+长期负债账面值上一财年普通股账面值资产负债率:上一财年总负债上一财年总资产盈利变动率(Earnings Variability):由收入变动率(VSAL)、盈利变动率(VERN)、现金流变动率(VFLO)、预测每股收益变动率(ETOPF_STD)四个三级因子构成。收入变动率:过去 5 年年收入标准差/平均年收入。盈利变动率:过去 5 年年净利润标准差/平均年净利润。现金流变动率:过去 5 年年现金

29、流标准差/平均年现金流。预测每股收益变动率:未来 12 月每股盈利预测标准差/现股价。盈利质量(Earnings Quality):由资产负债表盈余(ABS)和现金流盈余(ACF)两个三级因子构成。资产负债表盈余:基于资产负债表的盈余(ACCR_BS)通过资产负债表项目的连续变化和对折旧项目的处理计算得到。资产负债表盈余(ABS)=-基于资产负债表的盈余(ACCR_BS)/总资产。现金流盈余:基于现金流量表的盈余(ACCR_CF)通过对最新现金流量表项目和折旧项目的处理计算得到。现金流盈余(ABS)=-基于现金流量表的盈余(ACCR_CF)/总资产。中国股票风险因子模型白皮书第 13 页 共

30、73 页盈利能力(Profitability):由资产周转率(ATO)、毛利(GP)、毛利率(GPM)、资产收益率(ROA)四个三级因子构成。资产周转率:过去 12 个月收入/最新报告的总资产毛利:(上一财年收入-销货成本(COGS)/上一财年总资产毛利率:(上一财年收入-销货成本(COGS)/上一财年收入资产收益率:过去 12 个月净利润/最新报告的总资产投资能力(Investment Quality):由总资产增长率(AGRO)、发行股份增长率(IGRO)、资本支出增长率(CXGRO)三个三级因子构成。总资产增长率:将过去 5 年总资产对时间回归,得到回归系数;将回归系数除以平均总资产再取

31、负数,得到总资产增长率。发行股份增长率:将过去 5 年发行股份数对时间回归,得到回归系数;将回归系数除以平均发行股份数再取负数,得到发行股份增长率。资本支出增长率:将过去 5 年资本支出对时间回归,得到回归系数;将回归系数除以平均资本支出再取负数,得到资本支出增长率。3.2.6 动量因子动量因子(Momentum)动量因子由相对强度(RSTR)和历史 Alpha(HALPHA)构成。相对强度:首先以 126 天为半衰期,在过去 252 天的窗口内,计算股票超市场收益对数的指数加权和,作为非滞后的相对强度。接着滞后 11 天,计算 11 天窗口的非滞后相对强度等权平均值,以此作为相对强度。历史

32、Alpha:首先,以 126 天为半衰期,在过去 252 天的窗口内,按与计算 Beta 因子一样的方法(CAPM)取时序回归的截距项,作为非滞后的历史 Alpha。接着滞后 11 天,计算 11 天窗口的非滞后历史 Alpha 等权平均值,以此作为历史 Alpha。中国股票风险因子模型白皮书第 14 页 共 73 页3.2.7 成长因子成长因子(Growth)成长因子由预测长期净利润增长率(EGRLF)、每股净利润增长率(EGRO)、每股收入增长率(SGRO)组成。预测长期利润增长率:分析师预测长期(3-5 年)净利润增长率。每股净利润增长率:将过去 5 年每股年净利润对时间进行回归,得到回

33、归系数;将回归系数除以平均每股年净利润得到每股净利润增长率。每股收入增长率:将过去 5 年每股年收入对时间进行回归,得到回归系数;将回归系数除以平均每股年收入得到每股收入增长率。3.2.8 分红因子分红因子(Dividend Yield)分红因子由股息率(DTOP)和分析师预测股息率(DTOPF)构成。股息率:过去 12 个月每股分红/上月末股价。预测股息率:未来 12 个月每股预测分红/现股价。4.我们的风险模型我们的风险模型4.1模型估计方法模型估计方法4.1.1 极大似然法极大似然法不同于常见风险模型采用的 OLS 估计,我们的风险模型采用极大似然法估计因子收益率序列和协方差矩阵。极大似

34、然法的思想较为直观。已知随机样本满足某概率分布,但该分布参数未知,我们试图寻找一组参数,使在该参数条件下,样本出现的概率最大。我们把这样一组参数作为对真实参数的估计。对于多因子模型,+1=,+1+,+1(4.1)与 3.1.1 相同,首先用公司财务和交易数据计算出矩阵。接着用极大似然法,对因子收益率,+1、因子协方差矩阵和异质性收益率协中国股票风险因子模型白皮书第 15 页 共 73 页方差矩阵进行估计。做出以下假设:,+1 0,(4.2),+1 0,(4.3),+1与,+1相互独立。根据假设条件,由(4.1)的线性关系,我们可以推出,+1的分布:,+1 0,+(4.4)因此,对于一组样本,+

35、1,=1,2,,可以构造对数似然函数:,=log=11(2)/2+1/2?exp 12,+1+,+1(4.5)但是直接通过最大化似然函数的方法求解参数较为困难,因此我们引入 EM 算法,用迭代的思想求解参数和。4.1.2 EM 算法如何估计参数算法如何估计参数和和EM 算法分 E 步和 M 步两个步骤。在 E 步中,给定参数值11和样本收益率,计算出因子收益率的后验分布。在 M 步中,利用 E 步得出的因子收益率的后验分布,最大化对数似然函数,得到新的参数值。重复 E 步和 M 步直至参数收敛,即可获取参数和估计值。具体公式推导见附录 2。4.1.3 计算因子收益率计算因子收益率,+由 4.1

36、.2,我们通过 EM 算法估计出了参数和。在本节,利用已知的、和,可计算出因子收益率,+1。由(4.2),(4.4),,+1与,+1服从联合正态分布:,+1,+10?0?,+(4.6)11在第一次迭代中需设定参数的初始值。中国股票风险因子模型白皮书第 16 页 共 73 页由附录 1,,+1,+1=+1,+1=1,+1=+1,+1(4.7)或者进一步将因子收益率,+1的条件期望简化写作:,+1,+1=(+)1?(),+1(4.7)4.1.4 计算调整计算调整实证分析表明,EM 算法能够较好的解决线性回归模型的参数估计的准确性与稳定性问题,但是线性回归模型中的诸多不符合线性回归理想假设的情况仍然

37、需要克服,因此在线性模型进行参数估计时,需要对其中的相关数据进行对应调整。(1)异方差调整异方差调整线性回归模型中个股特质性收益率方差一致的假设,往往在现实情况中并不成立,有必要在估测时进行异方差调整。在第 3.1.2 中,大多数调整模型的方法是使用加权最小二乘法(WLS),其中的权重变量通常选用ME(这里 ME 代表流通市值),因此模型相当于假设,+11,。基于这个假设,数学上等价于在估测过程中,将每一个观测都除以=1:,+1=,+1+,+1(4.8)这个假设的合理性可以用两种方法加以验证:i.直接用个股全样本波动率对1ME进行回归;ii.通过对全样本用 EM 算法估测该因子模型,并分析异质

38、性收益率协方差矩阵的离散度进行验证。通过实证检验,我们发现,由于我国市场上个股的市值差距较大,中国股票风险因子模型白皮书第 17 页 共 73 页常见模型的权重假设可能使得小盘股权重过低,从而忽略很多重要的因子联动。基于进一步的实证分析结果,我们发现=Tvr,+1ME是更好的权重选择,其中 Tvr 代表换手金额,ME 代表流通市值。基于此,我们构造了新的权重调整矩阵:=10002000(4.9)因此,经过异方差调整,(4.1)被重写为1,+1=1,+1+?,+1(4.10)对(4.10)进行EM算法估算,我们会得到一个四元组(,),对模型目标资产协方差矩阵的估计可由下式表示:=11+=+(4.

39、11)(2)协方差矩阵估计调整协方差矩阵估计调整通过 cluster 法和 shrinkage 法,我们可以得到更为稳健的协方差矩阵的估计。聚类(cluster)方法的核心思想是将同处一个 cluster 的多个股票的残差归并为一个相同的值进行联合估计,以进一步减少模型参数,使结果更稳健。shrinkage 法是将协方差矩阵的估计向均值进行收缩调整,从而提升协方差矩阵估计的稳定性。我们根据每只股票的观测数据量划分权重i,并根据权重大小确定收缩比例?,最后得到按比例收缩调整后的。?=?,?=i(4.12)=5%(4.13)?=max 1 1?,(4.14)=1?+?(4.15)4.1.5 共线性

40、调整共线性调整中国股票风险因子模型白皮书第 18 页 共 73 页如果因子出现完全共线性,横截面回归模型会直接出现无法计算的问题,EM 算法也会因为出现不可唯一辨识的因子组而在进行 M 步时导致不稳定进而估计结果难以收敛。因为如果有两组甚至多组因子可以生成完全一样的,根据(4.5),对数似然函数在这些不同因子组条件下取值相同,这会导致 M 步在这些值附近跳跃,从而无法得到一个唯一的收敛值。因此,在有共线性存在时,我们需要进行共线性调整,模型中唯一的共线性来源于行业因子和国家因子。首先,在原始矩阵中选出不共线因子的子集,即剔除国家因子的 N(K-1)阶矩阵,该矩阵不存在共线性问题。接着将剔除国家

41、因子后的矩阵输入 EM 算法进行对的估计,再将通过特定的矩阵变化转化为12。4.1.6 模型估计方法的优劣对比模型估计方法的优劣对比EM 算法也有其缺点,主要体现为其计算复杂耗时,收敛的速度相当依赖于和的初始值。作为改进,我们可以使用横截面回归的结果作为初始值,使初始值较为接近收敛位置,降低估算时间。在此改进基础上,EM 算法具有以下优势:1.更优解:每一步的 EM 回归迭代都会提高 likelihood,其结果一定会收敛。因此从 OLS 的回归结果出发,进行 EM 迭代,在 likelihood的测量下一定会得到更优解。2.稳定性(噪音抵抗性)更强:EM 算法的稳定性远优于横截面回归,具体表

42、现为它有更强的噪音抵抗性。它的因子模拟投资组合取决于因子组曝露和资产的协方差矩阵(,+1=+)。因此,在对因子组微调的时候,资产间的联动性和模拟投资组合变动都不大,,+1的变化不大,原有因子的因子模拟投资组合受到的影响也不会大。反观横截面回归方法,加入/删减因子均可能导致()1发生剧烈改变。12详见附录 3.中国股票风险因子模型白皮书第 19 页 共 73 页3.更好应对数据缺失:金融市场数据集中缺失值是非常常见的,如果不能得到恰当处理,传统的 OLS 算法会对缺失值产生较大的调整,而,EM 算法的稳定性则能够在数据采集不完全的情况下依然可以给出良好的估计结果。4.假设更合理:在 OLS 回归

43、中,模型假设与,+1独立;而本模型假设,+1与,+1相互独立。在金融市场实践中,与,+1独立的假设是很少成立的。资产收益、因子暴露、残差等变量常常出现较为异常的特性,比如残差波动与某些因子暴露相关。在实践意义上,,+1与,+1相互独立的假设更为合理。对于 OLS 和 EM 算法下,残差的相关性对比,我们设计了一下测试:1.在测试中使用了真实的因子暴露数据,我们使用 2017 年-2020年三年的数据,随机抽取 500 支股票在六个技术面因子上的暴露作为。2.使用标准正态分布生成模拟的因子收益。3.使用和随机正态分布模拟残差,使得生成的残差与因子暴露的相关性不为 0。具体测试中,我们使用某个因子

44、的三次方来作为残差的非独立部分,然后通过调整系数来调节残差中独立与非独立的比例,如当残差中非独立的比例为 80%时,总残差=0.8*(非独立残差)+0.2*(独立残差)。4.使用模拟的因子收益和残差,获得模拟股票收益。5.将真实因子暴露与模拟股票收益分别送入 EM 与 OLS 方法进行回归,二者分别给出预测残差。6.分别计算两种方法得到的残差与模拟生成的精确残差的相关性,进行比较。7.改变模拟残差中独立/非独立部分的比例,可以获得两条 相关性vs 比例的曲线。我们将结果总结为图 1-图 4:中国股票风险因子模型白皮书第 20 页 共 73 页图 1预测残差与真实残差相关性(针对 Beta 因子

45、的估计)图 2预测残差与真实残差相关性(针对年化交易量比因子的估计)中国股票风险因子模型白皮书第 21 页 共 73 页图 3预测残差与真实残差相关性(针对市值因子的估计)图 4预测残差与真实残差相关性(针对短期反转因子的估计)中国股票风险因子模型白皮书第 22 页 共 73 页图 1至图 4中横坐标为残差中非独立的可解释部分的比例,括号中标明非独立残差由哪个因子暴露的三次方得到,如(beta)表示残差中的非独立可解释部分是由 beta 因子暴露的三次方得到的。纵坐标为回归计算预测的残差与真实残差的相关性,具体计算方法为:在每一种比例下,两种回归方法加上模拟生成的精确值,每支股票均可以得到三个

46、残差的时间序列,两种回归方法的时间序列分别与精确值的时间序列计算相关性,于是每支股票每种方法都可以得到两个相关系数,两种方法分别取 500 支股票的相关系数的 mean,于是在每种比例下,每种方法得到一个相关系数的 mean 值。然后我们连续改变残差中独立/非独立部分的比例,得到两条曲线。如图 1 至图 4 所示,与 OLS 估计的残差相比,EM 方法估计的残差与真实残差的相关性更强。更高相关性意味着 EM 算法计算的残差能够更好的反应真实残差。这也说明了 EM 算法优势。4.2 风险因子模型的评价标准风险因子模型的评价标准一个好的风险因子模型应该满足以下几个标准:(1)风险因子度量准确计算因

47、子的数据集应尽量少包含缺失数据,同时保证因子数据的信息不损失。较少缺失值保证了计算过程中未缺失信息的利用效率,这能确保尽量多的信息纳入了模型之中。(2)风险因子体系能准确地刻画金融资产联动关系风险因子对资产收益率的解释应该足够够高、整个风险因子模型对资产收益联动的变化关系也应该有很好的解释力。这保证了基于风险因子体系的模型能明确展示出市场的现状和金融体系正在发生的变化。(3)风险因子模型能正确指导决策风险因子模型需要正确地刻画风险,基于此给出的投资建议需要明确、一致且连续。这要求风险因子值要尽量少的出现极值,而且风险因子值不能有过分的跳跃,风险因子模型得出的结果也要求比较稳定。中国股票风险因子

48、模型白皮书第 23 页 共 73 页(4)风险因子体系开放、易扩展风险因子体系应该是开放的,需要很容易地容纳新的因子,从而适应世界的变化。4.3 中国风险因子模型的评价方式中国风险因子模型的评价方式将风险因子评价指标进一步细化为可度量的指标,并针对中国风险因子模型进行了量化评估:1.完备性:中国风险因子模型使用每天有因子值的股票数量与上市股票数量之比计算的覆盖率来衡量因子数据的完备程度。利于模型参数估计,要求筛选因子组合的覆盖率高于 50%。2.正态性:使用因子值的 5%至 95%分位数衡量因子极值的分布情况,因子回报分布尽量接近正态分布。3.连续性:使用因子值月度自相关系数 AR1 大小来衡

49、量因子值的连续性。AR10.95 为连续性较好。4.相关性:使用因子相关系数矩阵来判断因子间的相关程度。在每一个方向的因子组中,尽可能取其中跨组相关性小的因子。5.解释能力:中国风险因子模型还使用单因子加行业因子衡量单个因子的解释力,使用包含全部因子模型的 log_likelihood 衡量模型解释资产联动的能力。4.4 中国风险因子中国风险因子描述描述4.3.1.规模规模4.3.1.1.规模规模表 1 规模因子描述统计Factor描述LOGCAP流通市值的自然对数(log(size))MIDCAP总市值(总市值三次方与 log 市值回归的残差)Factor覆盖率AR1LL 提升CUFMIGS

50、MLOGCAP1.000.9923049.55达标或采用YesYesYesYesYesMIDCAP1.000.989977.05达标或采用YesYesYes中国股票风险因子模型白皮书第 24 页 共 73 页规模规模:规模因子是代表股票回报相关的重要来源,并捕捉大型股和小型股之间的回报差异。我们用市值的对数来衡量规模。上表中汇报了规模因子下的三级因子:流通市值的自然对数和总市值。其中,流通市值的自然对数覆盖率为 100%,AR1 为 0.99,LL 提升为23049.55;总市值覆盖率为 100%,AR1 为 0.99,LL 提升为 23049.55;根据评价标准,流通市值的自然对数达到了完备

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服