A picture is worth a thousand words: Measuring investor sentiment by combining machine learning and photos from news
type
Post
status
Published
date
Apr 16, 2022
summary
在过去,分析照片成本高昂且无法通过 "客观的外部测量 "来验证的;现在,机器学习的方法减轻了这种担忧。
tags
paper summary
Machine Learning
category
阅读笔记
password
slug
icon
- Journal of Financial Economics
- Obaid, Khaled, and Kuntara Pukthuanthong
What are the Research Questions?
由于现代技术和对快速信息的需求,图片新闻已经越来越受欢迎。研究表明照片可能比文字更有效地传达情感信息,在过去,分析照片是成本高昂,且主观的,无法通过 "客观的外部测量 "来验证,现在,机器学习的方法减轻了这种担忧。
过去行为模型的研究表明,悲观预测了市场回报率的逆转。本文将机器学习应用于基于情绪的经济文章照片分类,从大量新闻照片样本中获得的每日市场层面的投资者情绪指数(照片悲观度),从图片情感角度研究投资者情绪与股票收益。
What are the Academic Insights?
本文应用了基于卷积神经网络(CNN)的谷歌Inception(v3)预训练模型,根据情感对大量的新闻照片样本进行准确的、可验证的、低成本的分类:以迁移学习的方式,最终在测试样本达到了87.1%的准确率。通过上面的模型,作者得到了PhotoPes(图片悲观度)变量(在某一天预测为负面情感的照片比例)
- 我们表明表现出投资者情绪代理的特征。首先,我们测试PhotoPes与美国主要股票指数和交易所交易基金(ETF)的关系。行为模型,如De Long等人(1990年),预计投资者情绪应该预测市场回报的逆转。也就是说,当情绪高涨(低落)时,非理性的投资者会增加(减少)对资产的需求,推动价格上涨(下跌),脱离基本面。我们观察到PhotoPes与第二天的市场回报率呈负相关,与剩余交易周的市场回报率呈正相关。这种反转强调了我们的措施对回报率有非信息性的影响。就PhotoPes和第二天的市场回报之间的关系的幅度而言,PhotoPes的一个标准差变化对CRSP价值加权(VWRETD)指数的平均影响是4.2个基点。一个利用PhotoPes和新闻文本中的悲观情绪的逆转模式的交易策略,可以获得5.45%的年度五因素阿尔法。
- 作者接下来比较了PhotoPes和文本悲观度(TextPes)的预测能力:PhotoPes和嵌入在文本中的悲观情绪(TextPes)是显著相关的,表明这两个变量所捕获的信息类型有一些共同点。嵌入在新闻照片中的悲观主义和嵌入在新闻文本中的悲观主义可以相互替代。在新闻照片绝大多数都是负面或正面的时期,新闻照片中的悲观主义占主导地位。相反,当新闻照片是中性的或混合的时候,文字中的悲观情绪会占主导地位。
- 与基准时期相比,在恐惧感增强的时期,照片中嵌入的悲观主义的系数要大两倍以上,而TextPes的系数大致上没有变化。在恐惧期间,PhotoPes的一个标准差的变化对VWRETD的平均影响是10.3个基点。
- 作者进一步根据公司的特异性波动率和规模来构建投资组合。我们发现PhotoPes对最高的特异性波动率和最小的公司组合的收益影响最大。就幅度而言,PhotoPes的一个标准差的变化对最高特异性波动率的价值加权五分位数组合的平均影响是7.1个基点。
- 最后,作者发现,PhotoPes的高低可以预测第二天异常交易量的增加。这一证据进一步验证了PhotoPes能够捕捉到投资者的情绪。 最后,我们进行了一系列的稳健性测试。最值得注意的是,我们表明我们的主要结果对不同的变量构造标准是稳健的,甚至在控制了极端回报后也是如此。此外,我们表明PhotoPes产生了显著的样本外R-squared。
- 我们在金融决策的背景下调和了这两股文献。 最后,我们的论文扩展了关于视觉内容在预测金融市场重要结果中的价值的文献。一些研究记录了仅仅一张照片如何能够预测重要的结果,如政治选举、个人贷款决策、公司市值和CEO薪酬(Todorov等人,2005;Duarte等人,2012;Halford和Hsu,2014;Graham等人,2016)
Why does it matter?
- 我们的论文扩展了关于投资者情绪和新闻的文献。(据作者表述,这是第一个使用机器学习从新闻照片中开发投资者情绪代理来预测市场回报的文章)。新闻是投资者信念的一个合理的代理,因为新闻有需求方的激励来迎合读者的信念(Shiller,2005)。Mullainathan和Shleifer(2005)总结了传播学、心理学、记忆和信息处理方面的文献,这些文献支持人们从符合其信念的内容中获得效用的观点。Tetlock(2007)和Garcia(2013)表明,嵌入在新闻文本中的情绪预测了市场回报和交易量。 我们通过揭示新闻照片包含与金融市场相关的内容来扩展这一文献。 我们的论文还扩展了关于视觉刺激心理学的文献在金融和经济领域的应用。关于新闻中的视觉刺激的证据是混合的。
- 分析照片的机器学习技术日后必将越来越普及和完善。这一技术的发展将提高我们的能力,将网上上传的数十亿张照片中蕴含的丰富信息转化为对金融研究中核心问题的洞察力,对公司金融和资产定价都有影响。
- 在一个越来越多的多模态媒体现实中,未来的研究人员应该尝试推进照片分类的机器学习技术。这样做可以帮助弥合照片和文本分类模型之间的差距,更好地捕捉情感,并确定嵌入新闻照片的其他重要内容
The Most Important Chart from the Paper:
Abstract
通过将机器学习应用于基于情绪的准确和经济的照片分类,我们引入了一个从大量新闻照片样本中获得的每日市场层面的投资者情绪指数(照片悲观主义)。与行为模型相一致,照片悲观主义预测了市场回报率的逆转和交易量。这种关系在对套利限制较高的股票和恐惧感增强的时期最为强烈。我们研究了照片悲观主义和新闻文本中的悲观主义在预测股票收益方面是相互补充还是相互替代,并发现两者是相互替代的证据。
其他机器学习应用
Manela和Moreira(2017)使用机器学习从《华尔街日报》(WSJ)的文本中构建一个新闻隐含波动率指数
Buehlmaier和Whited(2018)通过分析财务报告构建了一个金融约束的衡量标准,并表明他们的衡量标准与获得资本和股票收益有关。
资产定价研究人员将机器学习应用于金融数据,以预测风险溢价(Gu等人,2020),并寻找真正的风险因素(Feng等人,2020)