2000-2025年Fama-French五因子模型数据+Stata代码

Fama-French五因子模型是金融经济学中用于资产定价的一个重要模型,由Eugene Fama和Kenneth French在1993年提出的三因子模型基础上,于2013年进一步扩展而来。本次分享五因子模型的数据和计算代码,如需三因子模型的相应内容,也可文末联系客服获取。

(一)理论背景

    在1993年,Fama和French两个人就已经发表了他们的三因子模型,认为股票的超额收益可以由市场风险、市值风险、账面市值比风险来共同解释。把个股的超额收益率分解成市值因素、账面市值比因素和其他未被解释的因素。用数学表达式表示如下:

Ri=alpha+biRM+siE(SMB)+hiE(HML)+ei

  其中Ri=ri−rf,是股票i比起无风险投资的期望超额收益率,RM=rM−rf,是市场相对无风险投资的期望超额收益率,E(SMB)是小市值公司相对大市值公司股票的期望超额收益率,E(HML)则是高B/M公司股票比起低B/M的公司股票的期望超额收益率,而 ei是回归残差项。

   在过去20年中,有许多学者对于该三因子模型进行实证研究,发现有许多股票的ai显著不为0,这说明三因子模型并不能很好地解释所有超额收益。后来,Fama和French发现在上述风险之外,还有盈利水平风险、投资水平风险也能带来个股的超额收益,并于2013年提出了五因子模型。在原有三因子模型的基础上增加了投资因子 CMA 与盈利因子 RMW。该模型更加充分地解释个股的超额收益,其表达式为:

Ri=alpha+biRM+siE(SMB)+hiE(HML)+riE(RMW)+ciE(CMA)+ei

  与三因子类似,参数估计的方法仍然是用多元线性回归的方法,这里的alpna则是五因子模型里面尚未解释的超额收益。

(二)因子原理

1.规模因子SMB

  市值风险是指公司的规模对该公司股票的风险有着接影响:资产规模小,风险就会相对增加,反之,资产规模大,风险就会相对减少。企业的资产规模与风险的这种关系已经被广泛投资者所接受。

  在五因子模型中,我们将数据范围内的所有股票按市值分成两组:规模的分组点为中位数,前50%为小规模组,后50%为大规模组。记小市值股票的平均期望收益率为E(rS),大市值股票的期望收益率为E(rB)。那么E(SMB)=E(rS)−E(rB)。

2.价值因子HML

  账面市值比就是账面的所有者权益除以市值(即B/M)。账面市值比风险描述了公司的额外财务困境风险,说明市场上对公司的估值比公司自己的估值要低。一般来说,低B/M的公司销售状况或盈利能力不佳,这些公司往往需要更高的收益来补偿。同样的,我们将数据范围内的股票按账面价值比分为三份,记高B/M股票的平均期望收益率为E(rH),低B/M股票的平均期望收益率为E(rL)。那么E(HML)=E(rH)−E(rL)。

3.盈利因子RMW

   盈利能力较高的行业一般伴随着更高的风险,因此带来的风险称作盈利风险。与SMB和HML类似,我们将后1/3的高盈利能力公司的平均期望收益率减去前1/3的低盈利能力公司的平均期望收益率,得到盈利因子RMW。这里的盈利能力用ROE衡量。

4.投资因子CMA

  投资水平可以用再投资率来衡量。我们认为,投资率偏低的公司风险较大,投资者对这些公司有着更高收益率的要求。这里的投资率我们用总资产年增长率来衡量。同样的,我们用后1/3的低水平投资公司平均期望收益率减去前1/3高水平投资公司的平均期望收益率得到投资因子CMA。

(三)因子构建

1.规模的分组点为中位数,前50%为小规模组(S,Small),后50%为大规模组(B,Big)

2.账面市值比的分组点都为第30个和第70个百分位数,前30%为低账面市值比组(L,Low),中间40%为中账面市值比组(N,neural),后30%为高账面市值比组(H,High)

3.将市值和账面市值比两个指标交叉, 可把全体股票分成SH、SN、SL、BH、BN、BL 六个组合

4.分别以营运利润率和投资风格代替账面市值比,重复上述步骤, 可把全体股票分成 SR、SN、SW、BR、BN、BW、SC、SN、SA、BC、BN、BA 这12个组合, 其中营运利润率前30%为盈利疲软组(W,weak),中间40%为盈利中等组(N,neural),后30%为盈利稳健组(R,robust);投资前30%为投资保守组(C,conservative),中间40%为投资中等组(N,neural),后30%为投资激进组(A,aggressive),接下来计算上述各组合每一期的市值加权平均收益率;

5.最后, 利用不同组合收益率之差构造四个因子。

分25组回归的时候计算组合收益率采用流通市值加权平均法计算的组合收益率

[图片]

(四)数据说明

1.数据年份:2000-2025年

2.数据范围:全部A股上市公司

3.说明:包含原始数据、处理代码、最终结果。上市公司年度财务报表一般在次年3、4月份公布,即t年末的财务数据因年报公布的滞后性在t+1年4月份披露财务报表时才得到更新。因此选取t年5月至t+1年4月作为组合构建周期。在样本筛选过程中,已按照常规剔除方式对金融行业、ST、PT等异常样本。

4.部分文件截图(下图为2024年文件,2025年可能有所变化):

[图片]

[图片]

[图片]

[图片]

参考文献:

[1] 李志冰, 杨光艺, 冯永昌,等. Fama-French五因子模型在中国股票市场的实证检验[J]. 金融研究, 2017

[2] 赵胜民, 闫红蕾, 张凯. Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J]. 南开经济研究, 2016

[3] 吴敏华.Fama-French五因子模型在中国A股市场的实证研究[D].吉林大学,2016.

顶部专栏分享更多内容

来源:Paper数据分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值