Relative Sentiment and Machine Learning for Tactical Asset Allocation
type
Post
status
Published
date
Jun 21, 2022
summary
对于相对情绪因子,使用机器学习模型后能够提取更多的预测信息..
tags
paper summary
category
阅读笔记
password
slug
icon
- working paper
- Sanjeev Bhojraj and Wuyang Zhao
- A version of this paper can be found
到2019年中期,我们已经在实时资产管理中运行了几年的相对情绪指标组合(相对情绪是一种因子,衡量机构投资者和散户投资者的差异)。
该组合的组成部分之一是一个关注Sentix情绪指数的策略。
Sentix:一家德国公司,它每周都会分别对机构和个人进行调查,了解他们对全球各种市场和经济的当前和未来前景
当时,我们基于Sentix的相对情绪策略简单得令人尴尬:我们把四个不同地区的月度机构经济情绪和个人经济情绪之间的差额,即美国、欧洲、日本和亚洲(日本除外)的相对情绪指数,留给我们四个相对情绪指数。
正的指数值意味着机构比散户更看好某个地区未来6个月的经济。
在每个时间点上,我们将指数为正的市场数量乘以25%,得出该策略所需的股票配置。
例如,如果四个地区中的三个有积极的相对情绪,我们期望的股票配置将是75%。可以看出,该策略的股票配置是离散的--它只能采取0%、25%、50%、75%或100%的数值,这取决于具有积极相对情绪的地区数量。
投资组合中未投资于股票的部分被投资于一个综合债券指数。
下面是截至2019年9月对这一简单策略的回测,与美国的60/40策略进行了比较:

注:这些结果是假设的结果,不是未来结果的指标,也不代表任何投资者实际获得的回报。指数是未经管理的,不反映管理或交易费用,而且不能直接投资于指数。
尽管该策略的表现相对稳健,但我们想知道我们是否能够通过使用机器学习来提高其表现。
我们最近利用“Commitments of Traders Report”的数据写了一篇关于相对情绪的论文,论文表明,由相对情绪衡量的机构有显著的能力,为股票市场和Smart Beta因素择时(在中期时间范围内),并具有显著统计意义。
我们简单的Sentix相对情绪策略似乎证实了我们的信念,即相对情绪是一种反常现象。但鉴于其简单性,我们认为也许有一种方法可以从数据中提取更多信息。
因此,我们决定开展一个项目,将各种机器学习算法应用于Sentix的数据。结果是相当令人鼓舞的,似乎进一步支持了相对情绪作为一个因素具有不可忽视的预测能力的观点。我们在SSRN论文《相对情绪和机器学习的战术资产配置》中发表了这些结果。在此,我们将对这项研究的结果进行总结
数据
对于月度相对情绪数据,我们使用了Sentix在美国、欧洲、日本和亚洲(日本除外)的机构和个人6个月远期经济情绪指数的差异。
我们从Ken French教授的数据库中获得了这些地区的月度股票回报率
Methodology
我们将各种机器学习(ML)算法应用于Sentix的相对情绪数据。这些ML算法来自各种R软件包。
由以下四个元素组成的每个四元组构成了一个策略。
一种特定的机器学习算法(例如,随机森林回归,支持向量分类)。
该算法的一组特定参数。
一组特定的输入相对情感指数(我们研究了两个或多个地区的所有组合),以及
某一地区的月度股票收益的时间序列
每个策略的输出是对所考虑地区的股票分配的预测时间序列。
我们使用组合交叉验证法(CCV)(3) 来构建策略的训练和测试。
对于每个地区,有990种不同的 "策略"(由不同的ML算法、不同的ML参数和不同的相对情绪指数输入组合产生)。
一旦一个策略产生了一组预测的股票配置,我们就把这些配置变成两个不同的战术策略
--一个是把投资组合中的非股票份额投资于债券(即一个总的债券指数)--类似于人们在实践中可能做的事情
--另一个是把投资组合中的非股票份额投资于现金,以便分离出策略的股票预测能力。
因此,对于每个地区,我们最终有一组990个投资于股票和债券的战术策略和一组990个投资于股票和现金的策略。由于我们使用两套不同的CCV参数进行分析,我们最终得出了以下四套产出。
990个策略。股票+债券,CCV{15,2}。
990个策略。股票+现金,CCV{15,2}。
990种策略:股票+债券,CCV{15,2}。股票+债券,CCV{24,2}。
990种策略:股票+现金,CCV{24,2}。股票+现金,CCV{24,2}。
然后,我们对独立成分的情绪重复上述过程。也就是说,我们没有使用相对情绪作为策略的输入,而是使用机构和个人情绪指数本身。
例如,如果相对情绪策略的输入特征是欧洲的相对情绪和日本的相对情绪(即两个输入特征),相应的成分情绪策略将使用欧洲和日本的机构和个人情绪(即四个输入特征)。
其目的是看独立的成分指数是否比相对情绪指数提供更多的预测信息。
最后,由于每个地区有这么多不同的输出策略,自然会发现一些仅仅是随机的机会,看起来不错。评估众多策略中的某一策略是否真的具有统计学意义的一种方法是使用所谓的 "多重假设检验"(MHT)算法(4)。
因此,我们采用了MHT算法来确定哪些策略在不同的统计意义水平上是合法的。
Statistical Significance of Strategies
对于MHT算法,我们研究了六个不同的统计意义水平(注意:这些水平并不对应于假设检验中众所周知的P值),即0.01、0.02、0.05、0.10、0.15和0.30。López de Prado和Lewis(2018)(5)表明,任何低于0.30的水平都是保守的,很可能会导致拒绝合法的重要战略。因此,人们可以认为我们的水平(低至0.01)是过于保守的。
下表的(a)部分显示了在上述每个水平上显著的美国相对情绪策略的数量。(b)部分显示了同样显著的美国成分情感策略的数量。
看一下(a)部分的第一行,我们看到对于由股票和债券组成的策略,CCV参数为{15,2},990个美国相对情绪策略中有359个在0.30水平上是显著的。在0.01的水平上,有34个仍然是显著的。
相比之下,美国的成分情感策略中只有29个在0.30水平上是显著的,没有成分情感策略在0.01水平上是显著的。很明显,相对情绪比成分情绪提供了更多的预测信息。
对于非美国地区,虽然显著的相对情绪策略的总体数量比美国少得多,但也观察到同样的现象。也就是说,在每个显著性水平上,特别是在最严格的显著性水平上,相对情感策略的数量往往多于具有显著性的成分情感策略(成分情感策略很少出现在这里)。
Economic Significance of Strategies
除了研究相对情绪策略的统计意义,我们还通过将它们的表现与一组基准进行比较来研究其经济意义。
我们将每个地区前10名相对情绪策略的平均表现,与股票/债券基准和股票/现金基准(在所考虑的地区)的表现进行比较。为了进行苹果对苹果的比较,每个地区的基准的股票分配每月被重新平衡,等于该地区的综合相对情绪策略的时间加权平均股票分配。(例如,随着时间的推移,美国综合相对情绪策略的平均股票配置约为73%。因此,为了比较的目的,美国基准的股票分配被设定为73%)。我们对股票/债券和股票/现金策略以及两种CCV参数都进行了这种分析。
下图和表格显示了美国的结果。相对情绪在绝对值和风险调整值方面都明显优于静态基准的表现。我们观察到非美国地区有类似的相对表现。
值得注意的是,无论我们看的是哪种组合,基于机器学习的美国综合相对情绪基本上是本文开头所示的 "简单的Sentix相对情绪策略 "的回报率的两倍。由此看来,基于集合的机器学习方法能够从Sentix数据中提取额外的信息。
Relative Sentiment Trumps Momentum
我们的第一篇相对情绪论文得出的一个更有趣的结果是,当动量为负但相对情绪为正时,股票往往有最好的回报。我们想看看这一观察是否也适用于基于Sentix的相对情绪。
为了衡量这一点,我们研究了每个地区的股票指数的月度回报,其条件是该地区在上个月底的相对情绪和时间序列动量(TSM)的状态。下表显示了所有地区的结果。
看看美国,我们发现,当TSM为负值且相对情绪也为负值时,1个月的美国股票平均远期回报率为-3.4%。这就是说,当机构看跌时,不要买入下跌的股票!
相反,当TSM为负值但相对情绪为正值时,1个月的美国股票平均收益率为+3.0%。也就是说,当机构看涨时,买入跌停板是有回报的。
这两种状态的年化回报率之差为77.5%。这些发现印证了我们最初的相对情绪论文的结果。其他地区的结果在方向上是相似的。
结果是。
了解相对情绪的状态比了解时间序列动能的状态更能提供方向性的信息。
Relative Sentiment Along the Cross-Section
如上所述,ML策略的输出是预测的股票配置。我们想看看这些预测的分配在各地区的排名顺序是否能预测它们随后的相对回报。也就是说,预测股票配置较高的地区(来自于相对情绪)的表现是否优于预测股票配置较低的地区?这个问题的答案是肯定的,它证实了最初在这篇博文中报告的分析(使用一个完全独立的数据集)。
我们选取了每个地区的前50个相对情绪策略,并将它们在每个时间点的预测股票配置平均化,得出四个综合策略(一个是美国的,一个是欧洲的,一个是日本的,一个是亚洲(日本除外)的)。
然后,我们对这些地区在每个时间点上的综合预测配置进行排序。接下来,我们创建了四个策略。一个策略每月持有该月股票配置最高的地区;一个策略持有配置第二高的地区;一个策略持有配置第三高的地区;最后一个策略持有该月配置排名最低的地区。
下图显示了这四种策略的结果,从中我们可以看出,每个月持有预测股票配置最高的地区的策略,整体表现最好。每个月持有预测股票配置最低的地区的策略,其整体表现最差。而其他策略在正确的排名顺序中处于两者之间。
这表明,相对情绪可能有助于识别横截面上表现最好和最差的资产。

有一点需要注意的是--我们在写论文的时候忽略了这一点--有些地区(比如欧洲和亚洲(日本除外))没有50个符合MHT统计意义最低标准的相对情绪策略。
在这种情况下,创建每个地区前10名策略的组合,而不是前50名,可能更合适。
下面是前述截面表现图的再现,但只使用了每个地区的前10名相对情绪策略。总的表现顺序保持不变(尽管 "第二 "策略在早期就跳出来领先)。

Conclusion
对Sentix相对情绪数据的机器学习模型的应用似乎比我们原来的简单方法能够提取更多的预测信息。
这项研究的结果与之前使用完全独立的数据集产生的相对情绪结果相吻合。
结果的对应关系可能更多地说明了相对情绪这一因子(它拥有正向溢价,表示机构往往比个人表现好),而不是机器学习这一工具,因为机器学习模型好坏很大程度取决于输入特征。