量化投资
# 导语
1989年发表的论文《The Fundamental Law of Active Management》及其随后的相关论文揭示了寻求主动投资的α收益的数量化关系,这为主动组合投资管理带来一套令人信服的分析框架,这个数量化关系很好揭示了数量化技术(量化投资)可以如何或者应该如何切入投资管理领域。
和被动组合管理(passive porfolio management)相比,主动组合管理(active porfolio management)更显投资水平的能力,或者说运气。被动投资力求完全复制相应的基准成分股及其权重,所以每当某指数做成分股的调整时,新入选的股票会走稍微强,被剔除的股票会走弱,源于追踪该指数的被动型基金需要做仓位调整。主动投资积极发挥投资管理人的主观判断力,选股(stock selecting)和择时(market timing):选股在理论和实践上都是可行的;择时在包括市场择时和因子择时。
# 什么是α与β
资本资产定价模型(CAPM模型)强调证券市场组合是唯一的风险来源,个股的特别风险(specific risk)可以通过组合分散化,故不会有风险补偿。个股的期望超额收益仅与市场组合收益相关,且其关系为简单的线性关系:
E(Ri)−Rf=βi(E(RM)−Rf)
这里的,即个股和大盘的关联强度,Rf为无风险利率。
多因子模型进一步补充到个股的收益由K个共同风险因子的风险补偿决定,而且和其对各个因子的暴露程度成线性关系:
E(Ri)=Rf+∑factorj=1Kβi∗E(Rfactorj)
投资组合中源于这些风险因子带来的收益称为β收益,不可被这些风险因子解释的收益称为α收益。
信仰主动投资的人即使承认上述的理论,也认为现实世界市场不是一直以均衡或无套利状态下运行,故而他们相信,股票的收益率存在着
Ri=αi+Rf+∑factorj=1Kβi∗Rfactorj
对于某些股票是严格为正的,有些是严格为负的。他们致力于找到那些具有正的α的股票。α收益即为独立于其它具体风险的收益。某基金收益比之业绩基准收益存在显著的α的话即为下面关系中afund显著不为0:
Rfund−Rf=αfund+βi∗(Rbenchmark−Rf)
故α收益率即为上述回归残差收益率afund(residual return)。
# 寻找α有什么用
α收益是独立于其它具体风险的收益,寻找α收益可以在你不增加额外风险情况下获得额外收益。组合通过超配具有正α的股票,低配负α的股票,同时保持各风险因子的暴露程度与指数基准一致(各β不变)可以做到“战胜”指数基准。
同时,当存在稳定且可观的α时,可以通过对冲策略来对冲掉具体风险(比如做多股票通过做空股指期货对冲市场风险),而获得低风险、小回撤但稳健的回报。
# 主动投资策略如何寻找α
衡量一个主动投资策略的绩效最核心的指标是所谓的信息比例(IR,Information Ratio ),主动投资的α收益与该α波动程度的比值。它本质是一个风险调整后收益的衡量**。IR越大,说明该策略越有吸引力**。
IR=αAσ(αA)
IC是另外一个重要的指标,其衡量的是一个因子的预测收益率与其真实收益率的相关性,由通过计算股票的预测收益率(在t−1期末预测t期收益率)和真实收益率的横截面相关(cross- section correlation)得到:
IC=CORR(r^t|t−1,rt)
在一系列的简化假设下,存在如下的所谓主动管理基本定律(The Fundamental Law of Active Management): hat IR=IC∗N
N代表独立的投资决策次数。
大体意思是:如果你的策略基于某个因子值进行预测,则因子预测有效性高(即IC越大越好),同时预测的标的资产越多、预测的独立性越大越好(即N越大越好),IR就越高。
故性价比高的策略需要兼顾因子的预测能力及预测范围,如果某个有效的因子只能局限于预测少数的资产标的,则该策略IR不会高,同时明显限制了该策略可容纳的资产规模。
实务中确实存在这种情况,追求可靠性高的买卖信号时,它发出买卖信息的频率或标的总是比较地低和少,而频率高的策略,胜率却总是比较低。
# α的来源
在一些简化的假设下(各股票相同收益率分布等),对于用单因子预测股票收益率,可以得到如下的α来源:
αi=σ(ri)∗IC∗Zscore(i)
Zscore(i) 为股票i在该因子值的标准化得分。该公式表达的思想是:
α (残差收益率) = 波动率 * IC * 预测得分 =机会 * 预测能力 预测得分置信程度*
比如,盈利超预期因子,该因子通常与随后的股票超额收益(α ,实际收益率-预期收益率)存在强相关关系,假设IC值为0.8,代表该因子的预测能力相当高,股票A和B在该因子的标准化得分分别为1.2,1.8,相同波动情况下,则B的α 会更高,因为1.8意味着股票B比A更超预期,故其超原先预期收益的程度会更大。
该公式虽过于严苛的假设,实际应用受很大局限,但它提供了如下非常有意义的洞见:
- 波动率,即机会。没有波动的资产,或者波动低的资产,难以从中得到大的α
- IC,即预测能力,投资不过是一种预测,挖掘更多信息,寻找具有预测能力的因子,是获得更多α 的前提,这是决定主动投资战胜指数基准的根本因素。
- 预测得分,将IC的预测能力转为对各标的资产的打分,进而做到了正、负α 的区分。
IC,是所有主动投资策略的核心能力,尤其以量化投资的角度看,无非是运用更多更全的数据、更优化更先进的数学模型,挖掘出更有预测能力的高IC因子,当你具备高IC的因子时,上述公式告诉你,你可以获得高的α 。内幕消息就是那一类具有非常高IC,而普通人又无法拿到的因子。
# 现实世界
遗憾的是,现实世界,**任何因子的预测能力是动态变化的,即IC不是常数,一段时期该因子预测能力强,一段时期弱,甚至完全不相关。**筛选因子不难,利用各种回测平台,可以很快计算各个因子在过去的预测能力,你可以筛选各时间段平均IC绝对值大于某个阈值的因子作为有效因子。但因子择时仍然很困难,决定当下哪些有效因子在起作用,以及其有效性将会维持多久不是简单的事,因子择时仍有“艺术”成分,仍需投资者“拍脑袋”决定。国内券商的因子研究报告引用因子半衰期的概念,按某因子预测收益率排序筛选出来的前N个股票若超过一半的股票不在真实收益率排序top N时,说明该因子在当前开始失效,需要谨慎使用。
IC的波动性如此重要,以至于通过一些其他的简化条件,有:
IR=IC¯σ(IC)
即IR为IC的均值比其标准差,IC波动性被认为是投资策略的模型风险,如果投资策略IC方差大,意味着该策略在历史回测上表现良好,在未来可能遭遇滑铁卢。
寻找高IC的因子和机器学习中寻找有解释力的特征变量一样,属于特征工程的苦力活,可以用暴力的方法,搭一套大集群测试成千上万的的因子及其组合,力求找到最佳因子组合,也可以结合人的先验知识来自我定制。
# 结束语
α = 波动率 * IC * 预测得分 =机会 * 预测能力 预测得分置信程度*
虽然推导该公式相当复杂和些许牵强的假设,但不妨碍其给出了有力的洞见,相当于给出了主动投资管理的框架,对于使用大数据技术来助力主动投资策略的开发,更是相当有指导意义。实际中,可以不必直接预测股票的收益率,只需计算因子秩值及其收益率相关性(或者直接使用秩相关系数),或者自定义一种距离来衡量因子值和收益率之间的关系,当我们获得了高IC的因子时,我们按因子排序取top N的股票即可以作为我们的投资组合了。
参考文献
- Grinold, Richard. "The Fundamental Law of Active Management."journal of Portfolio Management, vol. 15, no. 3, 1989, pp. 30–37.
- Grinold, Richard C. "Alpha Is Volatility Times IC Times Score, or Real Alphas Don't Get Eaten."Journal of Portfolio Management, vol. 20, no. 4, 1994, pp. 9–16.
- Active Portfolio Management(2ed.Grinold,Kahn)