Miles 发布于2018-07-16
回复 0
浏览 76194
1
## 一、套利定价理论
在前一篇文章《套利定价理论》中,我们了解了套利定价理论的基本原理,所谓套利定价,通俗来讲就是一个预测模型,模型假定股票的超额收益可以由一些因素来决定,这些因素可以是市场风险、市值风险、估值风险等。然后我们通过某种方法将预测模型的参数做一个估计,再将估计得到的参数对本期内的超额收益进行预测,比较真实值和预测值。如果预测值大于真实值,说明理论上的超额收益大于当前实现的超额收益,那么根据有效市场假说和无套利均衡原理,未来的超额收益应该上升,反之亦然。
## 二、股票市值预测
2005年,哈佛大学 Matthew Rhodes-Kropf 教授以及杜克大学 S. Viwanathan 和 David T. Robinson 教授合著发表论文《Valuation Waves and Merger Activity: The Empirical Evidence》,该文章提出了股票市值分解的三因子模型:
$$m = \alpha_0 IND + \alpha_1 b + \alpha_2 ln(NI)^+ + \alpha_3 I_{(< 0)} ln(NI)^+ + \alpha_4 LEV + \epsilon$$
其中,$IND$为行业虚拟变量矩阵(若该股属于某行业,则将这一行业虚拟变量的值设为1,其他行业虚拟变量的值设为0),$m$为个股的对数市值,$b$为个股的对数净资产,$NI$为公司净利润,这里注意,为了区分净利润的正负,增加了一个代表正负的虚拟变量,当且仅当净利润为负时,这个虚拟变量的值为1,并且,取净利润绝对值的对数作为自变量。$LEVLEV$为公司的财务杠杆(负债除以资产)。文章使用用该模型对特定美股进行了回归拟合,结果发现平均拟合优度超过80%。
2012年,马里兰大学的 Charles R. Hulten 教授及其博士生 Janet X. Hao 发表了论文《The Role Of Intangible Capital in the Transformation and Growth of the Chinese Economy》,该文章提出了另一个股票市值预测模型:
$$m = \alpha_0 + \alpha_1 b + \alpha_2 RD + \alpha_3 O + \alpha_4 PE + \epsilon$$
其中,$\alpha_0$为年度虚拟变量矩阵,$m$和$b$的含义与上文相同,$RD$为对数开发支出,$O$为对数组织资本,$PE$为市盈率。文章选取了开发支出力度大的公司进行了回归,结果发现平均拟合优度达到了94%。
上述两篇文章都认为股票的市值是可预测的。由于股票价格等于股票总市值除以股票数量,因此在股票数量不变的情况下,对股票市值进行预测其实就相当于对股票价格做出了预测。因此,结合套利定价理论,我们可以构建这样一个策略:
1. 在截面上构建股票市值预测模型,得到股票市值的预测值;
2. 如果预测值大于真实值,说明理论上股票市值向下偏离了其理论值,该股票未来上涨的概率更大。
## 三、实证研究
结合上述两篇文献,本文选择了以下财务指标作为解释因子的自变量:对数净资产,对数净利润,公司财务杠杆,营业收入增长率,对数开发支出,以及行业虚拟变量,构建了如下市值预测模型:
$$ln(M) = \alpha_0 IND + \alpha_1 ln(B) + \alpha_2 ln(NI)^+ + \alpha_3 I_{(< 0)} ln(NI)^+ + \alpha_4 LEV + \alpha_5 G + \alpha_6 ln(D) + \epsilon$$
其中,$M$为市值,$IND$为行业虚拟变量(若该股属于某行业,则将这一行业虚拟变量的值设为1,其他行业虚拟变量的值设为0),$B$为净资产,$NI$为净利润,$I$为公司净利润虚拟变量(当净利润为负时,取值为1,否则取值为0)。$LEV$为财务杠杆(总资产/总负债),$G$为营业收入的增长率(同比),$D$为开发支出(空值用0填充)。
本文收集了全部A股2005到2018年的年报数据构建预测模型。同时,除了线性回归以外,本文还使用LASSO回归、随机森林回归、支持向量机回归等多种机器学习方法构建了预测模型。使用十折交叉验证误差计算的拟合优度($R^2$)统计结果如下表所示:
![股票市值预测模型统计1.PNG][1]
实证研究结果显示,从2005年到2017年,除了2008年的57%和2010年的54%以外,十折交叉验证误差的平均拟合优度几乎都超过了60%。说明模型对股票市值具有很好的拟合和预测能力。同时,在线性回归、LASSO回归、分类树回归、随机森林回归、支持向量机回归和Adaboost回归中,随机森林回归的效果最好,Adaboost回归的效果次之。因此,在后文的研究中,本文使用了随机森林回归作为预测模型的主要算法。
## 四、投资策略
结合上文的分析和研究,我们可以制定一个这样的量化投资策略:
1. 确定股票池,比如使用全部A股作为股票池;
2. 确定预测模型,比如使用随机森林该模型预测股票市值;
3. 设定调仓频率,比如 T=10,表示每隔10天进行一次调仓;
4. 设定建模区间长度,比如 S=60,表示每次建模都使用60天收益率建模;
5. 设定持仓数量,比如 N=10,表示挑选10只股票构建多头组合;
6. 构建APT策略,即:筛选上期$E(M_i)$减$M_i$最大的前N只股票。
需要注意的是,每个调仓周期,该模型都筛选了实际市值相比较于预测市值偏低的股票执行买入操作,而当该股票的实际市值上涨之后则执行卖出操作。因此,该模型的持仓一直都是市值相对偏低的股票,不可避免的在小市值股票上存在风险暴露。
----
* 本文参考了聚宽《【量化课堂】机器学习多因子策略》。
[1]: https://quant.gtja.com/img/89ce8f582acec89d373c116f7a606f53