> **来源:[研报客](https://pc.yanbaoke.cn)** # 投资者情绪能否预测时间序列动量? # ——“学海拾珠”系列之二百六十二 报告日期:2026-1-16 分析师:吴正宇 执业证书号:S0010522090001 邮箱:wuzy@hazq.com 分析师:严佳炜 执业证书号:S0010520070001 邮箱:yanjw@hazq.com # 主要观点: 本篇是学海拾珠系列第二百六十二篇。本文深入探讨了投资者情绪对A股市场回报的预测能力,通过构建主成分分析(PCA)情绪指数,并应用偏差校正的预测回归方法,揭示了情绪在短期呈现动量效应、长期转为反向预测的独特规律。研究结合时间序列和横截面分析,证实了情绪对市场回报的显著影响,尤其是在个人投资者主导、卖空受限的市场环境中,为行为金融理论提供了重要的实证支持。 # A股市场情绪预测的背景 A股市场中个人投资者占比较高,且存在严格的卖空限制,为检验情绪效应提供了“样本外”证据。本文基于1997年至2013年月度数据,构建PCA情绪指数(包含换手率、新开投资者账户数和市盈率),以解决传统情绪代理变量的噪音问题。研究核心问题是情绪是否以及如何预测市场回报,挑战了发达市场中情绪作为反向预测因子的主流观点。 # 相关报告 1. 《虚假信息可被容忍吗?解析其对波动的影响与边界——学海拾珠系列之二百六十一》 2. 《基于组合波动率与峰度的资产配置模型——“学海拾珠”系列之二百六十》 3. 《基于马氏距离K-Means聚类的价值- 成长股分类——“学海拾珠”系列之二百五十九》 4. 《重新审视回撤规则:实证反思与框架重构——“学海拾珠”系列之二百五十八》 5. 《所有日子并不平等:通过加权历史收益理解动量效应——“学海拾珠”系列之二百五十七》 6. 《重审股票投资组合中的持股数量——“学海拾珠”系列之二百五十六》 # 高级预测回归与偏差校正技术 研究采用单因子和多因子预测回归模型,并应用多种偏差校正方法(如mARM、uARM)以克服小样本偏差和变量持久性问题。实证设计包括短期(月度)和长期(多期)预测分析,以及横截面规模组合检验。例如,多期预测回归显示,情绪系数t统计量在短期(1-8个月)为正,长期(9-60个月)转负,验证了方法论在捕捉动态模式中的有效性。样本外测试和资产配置策略进一步强化了结果的稳健性。 # $\bullet$ 情绪从短期动量到长期反向的预测转变 PCA 情绪指数在短期呈现显著动量效应:偏差校正后斜率系数达 $1.50\%$ (月度),即情绪升高 1 个标准差预示下月回报上升 $1.50\%$ , $R^2$ 为 $2.95\%$ 。长期中,情绪转为反向预测因子,尤其在 3-4 年后显著负相关。横截面上,小盘股情绪敏感性更强,规模溢价在情绪高涨时扩大;全球情绪(以美国情绪指数代理)在长期产生负面溢出。 核心内容摘选自 Han X, Li Y 于 2017 年在 Journal of Empirical Finance 上发表的文章《Can investor sentiment be a momentum timeseries predictor? Evidence from China》。 # $\bullet$ 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 # 正文目录 1 引言 4 2文献综述 6 2.1相关文献 6 2.2 动量假设 7 3 数据与实证设计 8 3.1样本期与市场回报代理变量 8 3.2投资者情绪指数 8 3.3描述性统计 10 4 时间序列分析 11 4.1短期收益可预测性 11 4.1.1单因子预测性回归 11 4.1.2 多因子预测性回归 ..... 14 4.1.3 样本外可预测性 ..... 15 4.1.4 市场择时策略 ..... 17 4.2 长期收益可预测性 19 4.2.1 长周期预测回归 ..... 19 4.2.2全球情绪的影响 21 5 横截面分析 23 5.1按规模排序的投资组合 23 5.2全球情绪的横截面效应 25 6 讨论与结论 ..... 27 风险提示: 28 # 图表目录 图表1文章框架 4 图表2表1:数据来源 8 图表3图1:市场超额收益和投资者情绪(1997-2013) 10 图表4表2:汇总统计结果 11 图表5表3:单因子预测回归结果 14 图表6表4:多因子预测回归结果 15 图表7表5:样本外预测表现 17 图表8表6:交易策略 19 图表9图2:不同方法下多期可预测性规律 21 图表10图3:本土和全球投资者情绪指数 22 图表11图4:本土和全球情绪的多周期可预测性规律 23 图表12图5:基于OLS的多期横截面可预测性规律 24 图表13图6:基于MARM的多期横截面可预测性规律 25 图表14图7:基于OLS的全球情绪的跨期可预测性规律 26 图表15图8:基于MARM的全球情绪的跨期可预测性规律 27 # 1 引言 图表1 文章框架 资料来源:华安证券研究所整理 投资者情绪对资产价格的影响长期是金融经济学中争议性问题。理论方面,有效市场假说(EMH)支持者认为情绪影响“至多”可忽略,因理性投资者无情套利掉任何情绪引致的错误定价。然而,行为阵营理论家主张,由于著名套利限制论点(De Long 等人 1990a),情绪导致系统性偏离基本面价值。此外,Brown 和 Cliff(2005)与 Baker 和 Wurgler(2006)指出情绪倾向有持久效应,因此非知情投资者(如噪音交易者)需求冲击可能随时间相关,引致强劲持久错误定价。直观上,情绪对收益影响应在套利约束绑定市场(Kling 和 Gao 2008)或更文化集体主义且高度易从众市场(Schmeling 2009)更强。然则,投资者情绪是否影响资产收益是实证问题。 本文通过彻底研究中国股票市场中投资者情绪在多期限上的收益可预测性,关联上述经典却存争议主题。先前情绪预测力工作主要聚焦美国等其他发达市场(Brown和Cliff 2004,2005;Baker和Wurgler 2006,2007;Huang等人2014),并一 致发现情绪是强劲长期反向预测因子(Baker和Stein2004;Brown和Cliff2005; Baker等人2012)。高情绪长期关联低市场收益,暗示市场随时间修正。此外,反向可预测性在横截面更显著(Baker和Wurgler2006;Baker等人2012)。Baker和Wurgler(2007)将反向可预测性归因于情绪均值回复模式。即,情绪长期衰减,市场修正情绪引致错误定价。 不幸的是,相较于强劲长期可预测性,近期收益可预测性实证证据既稀少又模糊。使用广泛情绪代理变量,包括技术指标和调查类数据,Brown和Cliff(2004)发现很少证据表明情绪在周度和月度频率预测美国收益。然而,Huang等人(2014)发现一些统计证据,投资者情绪用对齐情绪指数负向预测未来月度收益,但用Baker和Wurgler(2006)情绪指数则取得不同的结果。 关于投资者情绪短期收益可预测性的实证证据激励作者开展深入研究,因广泛认知的情绪长期反向可预测性未必延续至短期。此外,相较发达市场,发展中市场倾向有绑定套利约束、普遍本地个人投资者、及对国际(机构)投资者开放度较低。因此,能否在不同市场环境中找到类似反向可预测模式仍是有趣未解问题。中国股票市场为此类样本外检验提供自然实验,秉承Lo和MacKinlay(1990)精神。其以区别于美国等其他发达市场的独特特征闻名。首先,其通常被视为由个人投资者交易主导。个人投资者在中国比发达市场有更大市场力量。其次,其因严格制度设置(如强卖空约束)而高度限制。高卖空成本也阻碍机构投资者通过反向交易噪音交易者从事价格稳定活动。所有这些独特特征,不同于美国市场,似乎更倾向非理性情绪导致短期未来收益增加预期可能性。 需注意若干先前研究已阐明情绪对中国股市影响。例如,Chi等人(2012)使用共同基金流量作为情绪代理,发现2004至2008年间高情绪股票比较低情绪股票获得高平均收益。然则,Kling和Gao(2008)记录基于调查的机构投资者情绪度量在日频无收益可预测性。Chen等人(2014)构建市场基础中国情绪指数,发现其情绪指数对市场变动有良好预测力。然其情绪指数包含理性和非理性成分,使预测力来源难以解释。与此类先前研究并列,本文以若干独特方式贡献于演进的情绪文献: 首先,强调关于情绪短期收益可预测性的竞争假设。对于普遍非理性投机(如正反馈交易)和绑定套利约束(如更强卖空约束和较低国际投资者开放度)的市场,投资者情绪水平很可能短期正向预测股票收益,同时长期仍负向预测股票收益。显然,此类观点挑战传统观点,即投资者情绪在几乎所有期限上是反向预测因子,这几乎完全取自美国等其他发达市场证据。 其次,结合若干不完美情绪代理变量,提取其共同成分形成实时市场基础情绪指数,跨度17年(1997-2013)。显然,更长更近期样本期保证对中国股市可能影响分析是最全面最新。例如,Chi等人(2012)使用仅覆盖2004至2008年样本。相较先前研究,更大样本量无疑增加文中用时序回归统计功效。 第三,恰当处理预测回归中固有Stambaugh(1999)估计偏误(当预测变量持久时),而此重要计量经济学问题在先前研究(如Chi等人2012)常被忽略。本文的模拟证据显示,情绪上普通最小二乘OLS)斜率系数倾向向下偏误至(虚假)反向可预测性发现。因此,采用若干精细计量技术,包括系数偏误减少和检验统计量野生自助法,提供令人信服证据,投资者情绪确实是中国后续月度市场收益可靠动量预测因子,确认动量假设。情绪一个标准差的增加转化为股权溢价每月上升 $1.50\%$ ,对所有市场参与者是经济显著结果。强劲正收益可预测性在单变量和多变量设定下均稳健,在样本内和样本外均具有统计和经济显著性。 第四,月度频率强劲样本外可预测性使我们能基于投资情绪强预测力构建盈利 投资策略。示例表明,基于情绪信号增强投资组合表现,并优于简单买入持有组合。更重要的是,若投资者遵循情绪生成交易信号而非过去收益,则经风险调整后获得更高回报。 第五,作者研究中国投资者情绪收益可预测性期限结构。多期限预测回归证据产生显著期限模式:投资者情绪从短期(如第一年内)动量预测因子转变为后续更长期限(二至五年)反向预测因子。情绪长期负向预测市场收益事实确认情绪著名反向可预测性,因情绪在未知长期限均值回复。作者也检验全球情绪对中国股市潜在溢出效应。对比本地情绪,作者发现全球情绪无即时影响,但在更长期限负向预测收益。 最后,作者执行一批横截面分析。使用规模排序组合作为不同情绪敏感性股票代理,发现本地投资者情绪更多是规模故事(Lee等人1991):情绪短期动量模式对小市值股票比大市值股票更重要。对比之下,全球情绪影响横截面差异似乎较小,因其跨规模组均匀负向预测长期股票收益。 论文结构如下。第2节首先介绍中国股票市场,然后回顾相关文献并提出竞争可检验假设。第3节描述数据来源、情绪指数构建和描述性统计。第4节提供各期限收益可预测性主要结果。第5节执行横截面分析。第6节讨论我们发现含义并总结。 # 2 文献综述 # 2.1相关文献 近年来,金融学中一个普遍的观点是,投资者情绪(定义为部分非知情投资者形成的非理性信念)在几乎所有时间跨度上都是未来股票回报的反向指标(Fisher and Statman 2000; Baker and Wurgler 2007): # 反向假说:投资者情绪对后续回报的净效应为负。 反向观点——高(低)情绪水平与后续时期低(高)市场回报相关——由Barberis等人(1998)的理论研究合理化,其中代表性情绪易感主体将当前趋势外推至未来(代表性偏差),通过推动价格远离基本面价值而对未来市场走势进行错误押注,并最终面临价格修正。 Warther(1995)提出了类似观点。他公式化了价格压力假说,即无根据的情绪需求(通过汇总的共同基金流量)不反映真实信息,会施加同期价格压力,并与后续时期较低的预期回报相关(价格反转)。DeLong等人(1990a)认为,情绪引致的错误定价为套利者提供了逆势盈利的机会,即所谓的"套利效应",这也导致投资者情绪对后续回报产生反向效应。因此,投资者情绪与后续市场回报之间的负相关关系可广泛视为间接证据,表明1)噪音交易者系统性地错误押注市场未来走向,和2)理性投资者从事价格稳定活动(如套利)以使市场价格回归基本面水平,即“聪明钱效应”。 实证上,来自美国市场(Baker and Stein 2004; Brown and Cliff 2005)及其他发达市场(Schmeling 2009)的充分证据支持了长期时间序列可预测性,从而证实了反向观点。此外,情绪的反向可预测性在横截面上更为显著(Baker and Wurgler 2006; Frazzini and Lamont 2008; Baker et al. 2012)。 尽管广为接受,但对上述情绪引致的回报反转模式进行有力检验本质上存在困难,因为对于这些检验应使用的合适时间框架缺乏明确指南(Warther 1995)。在一个极端,研究人员探索情绪在极短期(如周度或月度)的预测能力,如 Brown and Cliff(2004)所做。在另一个极端,实证学家也深入研究了情绪在一年至五年期限的回报可预测性(Brown and Cliff 2005; Schmeling 2009)。 检验投资者情绪与未来市场回报关系合适时间框架的不确定性,至少表明已记载的投资者情绪长期反向可预测性未必能延续至短期,例如周度或月度频率。一方面,高水平且缺乏事实依据的投资者情绪可能预示近期股票回报不佳(情绪与后续回报呈负相关)。另一方面,投资者情绪也可能在短期内对后续回报产生持续的积极影响(情绪与后续回报呈正相关)。若干行为学原因或现实世界机制可能导致情绪与未来回报在短期内存在这种正向关联机制。尽管文献未提供关于情绪与短期回报联系的完全指定模型,但若干研究提示了情绪可能在短期内影响未来回报的潜在方向,我们将在下一小节关于可检验假设中予以总结。 # 2.2 动量假设 情绪的反向可预测性在很大程度上建立在金融市场有效性的基础上。也就是说,理性投机者(知情投资者)通过逆情绪引发的趋势操作来稳定资产价格。然而,需要注意的是,金融市场上普遍存在的多种现实机制或摩擦限制了理性投机者的套利能力。其结果可能是,错误定价会持续较长时间,情绪水平也可能在短期内作为后续回报的动量预测因子。这并不令人惊讶,因为Kling和Gao(2008)发现,在中国,投资者情绪在短期内遵循正反馈过程。中国股市历史上经验观察到的长达数年、自我强化的价格泡沫(例如2007年的价格泡沫)也为这一论点提供了佐证。在下文为投资者情绪的另一种可能性,即动量可预测性,提供若干理由。 首先,套利——使错误定价资产回归其基本价值的活动——在实践中是有限的(Shleifer and Summers 1990)。与无限期限的理论假设不同,在实践中,理性投机者(如机构投资者)通常比噪音交易者(个人投资者)拥有更短的投资期限。较短的投资期限使他们尤其关注转售价格。噪音交易者风险带来的不确定性表明,逆噪音交易者而动的行为面临风险,至少在短期内,如果投资者情绪变得更极端,价格进一步偏离基本面水平,则可能招致巨大的财务损失,这就是著名的“创造空间效应”(De Long et al. 1990a)。因此,对转售价格的担忧限制了理性投机者在短期内承担价格稳定活动(套利)的能力。加剧理性机构投资者担忧的因素还包括标的资产的基本面风险(De Long et al. 1990a)、与同行的定期业绩评估以及卖空约束(或卖空成本障碍)。所有这些因素都可能导致噪音交易者引发的错误定价在较长时间内变得更加显著,从而在短期内导致投资者情绪与后续回报之间呈现正相关关系。 其次,Shleifer and Summers (1990) 提出,最强的行为倾向之一是外推或追逐趋势。投资是一个社会过程:情绪投资者通过所谓的“羊群效应”而得到强化。换言之,噪音交易者聚集进出市场,从事趋势跟踪策略,导致价格进一步偏离其基本水平。更戏剧性的是,“羊群效应”可能持续很长时间,随着时间推移情绪越来越高,新的投资者涌入市场,这导致了中国现象级的“存款搬家效应”,如Burdekin and Redfern (2009) 所记载。使用序贯决策模型,Banerjee (1992) 表明,后续投资者低估自己的信息而高估现有市场参与者的信息是合理的,从而导致羊群行为。羊群行为也意味着大范围的追涨杀跌活动,这会在后续时期扩大情绪引发的错误定价。因此,追涨杀跌行为假定情绪对未来回报有正向影响。 第三,鉴于正反馈交易者的普遍存在(De Long et al. 1990b),即使是理性投机者也会加入行列。在预期到正反馈交易者未来的购买力(如 De Long et al. 1990b 模型中所假设),理性投机者会先于他人买入,以便在随后卖出给正反馈交易者时 获利。该模型的精髓在于,知情的理性投机者利用那些将趋势远推至未来的他人的系统性偏差,通过先于这些正反馈交易者买入,推高资产价格,并在多个时间层面引发预期的情绪需求。只要正反馈交易者关注足够长的投资期限(基于他们错误的外推),预期会有一系列与他们的情绪正相关的已实现回报。因此,该模型的含义与情绪对未来回报的正向影响是一致的。 总体而言,对未来市场走势的错误认知在较长时间内变得更加显著的可能性,表明投资者情绪对后续回报存在动量可预测性,至少在短期内是如此。换言之,高情绪水平会导致后续时期的高股票回报。 动量假说:投资者情绪对后续回报的净效应为正。 # 3 数据与实证设计 # 3.1 样本期与市场回报代理变量 本文采用精心构建的A股数据集,数据来源于多个可靠渠道(见表1)。样本期横跨1997年至2013年,共17年。为恰当刻画市场整体表现,遵循Fama和French(1993,2012)以及Frömmel和Han(2014)的方法,将市场投资组合的总回报(包括股息)计算为所有可用个股的市值加权平均值,该方法避免了生存偏差。依照惯例,使用中国一年期银行定期存款的月利率作为无风险利率。市场超额回报即为市场投资组合回报与无风险利率之差。市场超额回报代理变量同时涵盖了资本利得和股息收入,优于纯粹的价格指数(如上证综指和深证成指)。 图表2表1:数据来源 Table 1 Data and data sources. <table><tr><td>Variables</td><td>Sources</td></tr><tr><td>Market capitalization (MV), Monthly return (Ret), Daily turnover (Turn), One-year time deposit rate (RF), Business cycle indicator (BCI), Industrial production (IP), Number of new opened individual investor accounts in Shanghai Stock Exchange (IIA), Money supply (M2), 30-day National interbank offer rate (IR), Exchange rate (CNY/USD), Consumer confidence index (CCI)</td><td>Thomson Reuters Data stream CEIC database</td></tr><tr><td>Market-wide PE ratio (PE)</td><td>CICC database</td></tr><tr><td>US sentiment index</td><td>Baker and Wurgler (2007)</td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 3.2 投资者情绪指数 为恰当衡量中国市场的整体情绪,首先寻找若干可靠的个体情绪代理变量:即市场换手率(TURN)、上海证券交易所新开立个人投资者账户数(IIA)以及市场价值加权市盈率(PE)。作者深知,对于市场情绪并无明确或无争议的度量方法。多数情况下,情绪代理变量具有国别特异性并受数据可得性限制。本研究纳入这些个体情绪度量指标主要基于可靠的经济理由、数据一致性及数据可得性。例如,根据Baker和Stein(2004)的理论依据,市场整体换手率被视为投资者情绪的直接度量。高市场换手率表明情绪投资者的需求旺盛,他们挤出了理性投资者,从而破坏了资产价格的稳定性。新开立投资者账户数也高度反映了投资者情绪(Chen et al. 2014):鉴于个人投资者强大的市场力量,新开户数的增加意味着来自个人投资者的需求更大。纳入市盈率指标遵循了Indro(2004)的相同逻辑。由于没有共同基金流量数据 来估算流入市场的资金增量,故使用估值比率作为流量数据的直接代理变量。其逻辑相当直接:只要(更多)资金涌入市场,估值比率就会走高。中国股市历史上剧烈的价格泡沫事件无一例外地与异常高的估值(PE)事件相关。原则上,这三个个体度量指标都是投资者情绪的良好候选变量,因为它们在牛市中数值较大,在熊市中数值较小,反映了与投资者情绪的正相关关系。此外,这些情绪代理变量在整个样本期间内皆可获得。 为恰当构建一个有效的中国市场基础情绪指数,仔细遵循了以下一系列统计步骤。 首先,如Baker和Wurgler(2007)所指出的,个体情绪代理变量可能存在与投资者情绪无关的确定性趋势。例如,在样本期间,换手率和新开立个人投资者账户数均呈现上升趋势,这反映了中国资本市场的空前增长以及个人投资者随时间推移不断增加的市场参与度。因此,遵循Baker和Wurgler(2007)及Chen等人(2014)建议的去趋势步骤,将个体情绪代理变量除以其前六个月的移动平均值进行缩放。此去趋势过程移除了确定性趋势,并有助于确保时间序列的平稳性。 其次,正如先前文献所指出的,这些情绪代理变量的变动既包含理性成分,也包含非理性成分。理性成分与宏观基本面的变化相关,因为情绪投资者接收到关于整体经济的噪音信号(Verma and Soydemir 2009)。为剔除或至少减轻“理性”效应,遵循 Baker 和 Wurgler(2006)及 Verma 和 Soydemir(2009)的正交化步骤,将每个个体代理变量对一组宏观变量(即工业生产总值增长率、货币供应量增长率、短期利率水平和汇率)进行回归。正交化得到的残差即为投资者情绪非理性部分的代理变量。 第三,采用Baker和Wurgler(2007)的主成分分析方法(PCA),从三个个体情绪度量指标(残差)中提取第一主成分作为市场基础的投资者情绪指数。原则上,捕捉了个体度量指标共同变动的第一主成分,应能恰当地代表中国(不可观测的)市场整体投资者情绪的时间变化。 主成分分析过程得到如下情绪指数,记为 $S^{PCA}$ 。 $$ S _ {t} ^ {P C A} = 0. 5 7 0 \text {T U R N} _ {t} ^ {O} + 0. 6 4 2 I I A _ {t} ^ {O} + 0. 5 1 0 P E _ {t} ^ {O} \tag {3.1} $$ 第一主成分解释了样本方差的 $67\%$ ,很好地捕捉了个体情绪代理变量的协同变动。使用下标 $\mathsf{O}$ 表示所有三个成分均已对宏观经济变动进行了正交化,以捕捉非理性情绪效应。所有三个代理变量的符号均符合预期,证实了与市场情绪的正相关关系。PCA情绪指数最看重IIA,因为其系数绝对值最大,这强化了新开账户数可衡量个人投资者非理性乐观程度的观点。为便于比较,作者还构建了一个朴素情绪指数,记为SNaive,它对三个情绪组合指标施加等权重;以及另一个排除了较不常用的成分PE的PCA情绪指数,记为SExPE。事实上,这两个替代情绪指数与原始PCA情绪指数高度相关,相关系数分别为 $98\%$ 和 $94\%$ 。 图1绘制了样本期内PCA情绪指数与市场超额回报的波动情况。最显著的特征是,情绪指数紧密跟随市场回报的走势,暗示两个序列的新息项之间存在高度相关性。此外,直观观察表明情绪指数是合适的,因为指数的峰值和谷值与A股历史上的重大事件发生时间吻合。例如,1999年6月的飙升可能是对该月证券交易印花税下调的回应,而2006年5月和2007年1月的峰值则分别与当时创纪录的553亿和1000亿元人民币的日成交额同时发生。最大的价格下跌(2007年后时期)也与 2007年10月至2008年10月期间连续的悲观情绪浪潮相一致。 图表 3 图 1: 市场超额收益和投资者情绪 (1997-2013) Fig. 1. Market Excess Returns and Investor Sentiment of the Entire Sample: 1997-2013. The solid line (the left y-axis) depicts the standardized investor sentiment index obtained from the principal component analysis, the PCA sentiment index. The solid bar (the right y-axis) depicts the (monthly) market excess return (in deciles) over the risk-free rate. The plot covers the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 3.3 描述性统计 表2提供了数据集的汇总统计量。月市场超额收益的算术平均值和标准差分别为 $0.16\%$ 和 $8.07\%$ ,表明月夏普比率为0.02,市场价格风险(定义为市场超额收益与其方差之比)约为0.25。一个重要说明是,相对较低的市场价格风险反映了普通投资者的隐含风险厌恶程度,表明中国投资者通常比发达市场的投资者风险厌恶程度更低。情绪指数、三个情绪成分指标以及其他经济变量均经过标准化处理,使其均值为零、方差为一,这将有助于后续预测性回归中它们经济显著性的比较。与文献一致,所有预测变量似乎都具有相当的持续性,其一阶自相关系数表明了这一点。相比之下,市场超额收益则未表现出序列相关性,因为其一阶自相关系数实际为零。 表2的下半部分展示了数据集的交叉相关系数。有几个显著特征值得注意。首先,市场超额收益与PCA情绪指数及其三个成分指标高度相关。这种正向的同期相关性与图1一致,表明情绪水平升高会推高资产价格,并在当期导致收益增加(价格压力)。这也强化了在后续估计中需要采用偏误减少技术的必要性,因为情绪和市场收益的新息项是高度相关的。其次,三个情绪成分指标彼此之间高度相关,强化了它们作为市场情绪代理变量的有效性。正交化后的市盈率(PE)与未正交化的市盈率之间的相关系数仅为0.26,远低于其与IIA情绪代理变量的相关系数,这进一步支持了其作为(非理性)情绪度量代理变量的有效性。第三,消费者信心指数(CCI)作为一种基于调查的情绪度量指标,与同期收益不相关。它也不与所有基于市场的情绪代理变量直接相关,因为相关系数略为负值,这进一步挑战了其作为中国情绪 代理变量的有效性。尽管一些研究倾向于使用 CCI 作为投资者情绪的代理变量(Schmeling 2009),但必须指出,CCI 关注的是消费者对经济整体前景的普遍预期,而非股票市场。情况确实如此,因为 CCI 与其他经济变量(如 BCI、IP 和 PE 比率)呈正相关。作者将在后续分析中进一步讨论 CCI。 In this table, we present the summary statistics for the monthly excess return of the market portfolio $(Ret_{t})$ , sentiment index constructed by principal component analysis $(S_{t}^{PCA})$ , the three composite sentiment proxies (all orthogonalized to macro effects): Turnover ratio $(TURNS_{t}^{O})$ , the number of newly opened investor accounts in Shanghai Stock Exchange $(IIA_{t}^{O})$ , and the value-weighted PE ratio $(PE_{t}^{O})$ . The business cycle indicator $(BCI_{t})$ , the growth of the industrial production $(IP_{t})$ , and the market-wide PE ratio $(PE_{t})$ . The upper part of the table reports the arithmetic mean, median, standard deviation, skewness, kurtosis, minimum, maximum, 25% and 75% quantile points, and first order autocorrelation coefficient, while the lower part the cross-correlation coefficients. The sample period is from July 1997 to December 2013. 图表4表2:汇总统计结果 Table 2 Descriptive Statistics. <table><tr><td></td><td>Obs.</td><td>Mean</td><td>Median</td><td>St. dev.</td><td>Min</td><td>Max</td><td>Skew</td><td>Kurt</td><td>25%</td><td>75%</td><td>Rho</td></tr><tr><td>\( Ret_t \) (%)</td><td>198</td><td>0.16</td><td>0.24</td><td>8.07</td><td>-28.11</td><td>29.03</td><td>-0.18</td><td>4.39</td><td>-5.19</td><td>4.91</td><td>0.04</td></tr><tr><td>\( S_t^{PCA} \)</td><td>198</td><td>0.00</td><td>-0.18</td><td>1</td><td>-1.85</td><td>3.75</td><td>1.06</td><td>4.58</td><td>-0.65</td><td>0.55</td><td>0.70</td></tr><tr><td>\( TURN_t^O \)</td><td>198</td><td>0.00</td><td>-0.15</td><td>1</td><td>-2.77</td><td>3.19</td><td>0.77</td><td>4.37</td><td>-0.68</td><td>0.56</td><td>0.56</td></tr><tr><td>\( HAI_t^O \)</td><td>198</td><td>0.00</td><td>-0.13</td><td>1</td><td>-2.94</td><td>3.35</td><td>0.91</td><td>4.78</td><td>-0.63</td><td>0.46</td><td>0.63</td></tr><tr><td>\( PE_t^O \)</td><td>198</td><td>0.00</td><td>0.01</td><td>1</td><td>-3.12</td><td>2.55</td><td>-0.35</td><td>3.93</td><td>-0.51</td><td>0.59</td><td>0.83</td></tr><tr><td>\( CCI_t \)</td><td>198</td><td>0.00</td><td>0.26</td><td>1</td><td>-2.39</td><td>1.45</td><td>-0.52</td><td>2.23</td><td>-0.81</td><td>0.79</td><td>0.92</td></tr><tr><td>\( BCI_t \)</td><td>198</td><td>0.00</td><td>0.15</td><td>1</td><td>-2.42</td><td>1.76</td><td>-0.44</td><td>2.52</td><td>-0.61</td><td>0.74</td><td>0.97</td></tr><tr><td>\( IP_t \)</td><td>198</td><td>0.00</td><td>-0.03</td><td>1</td><td>-2.89</td><td>2.66</td><td>-0.10</td><td>2.69</td><td>-0.81</td><td>0.80</td><td>0.58</td></tr><tr><td>\( PE_t \)</td><td>198</td><td>0.00</td><td>0.12</td><td>1</td><td>-1.93</td><td>1.69</td><td>-0.28</td><td>1.85</td><td>-0.94</td><td>0.81</td><td>0.98</td></tr><tr><td></td><td>\( Ret_t \)</td><td>\( S_t^{PCA} \)</td><td>\( TURN_t^O \)</td><td>\( HAI_t^O \)</td><td>\( PE_t^O \)</td><td>\( CCI_t \)</td><td>\( BCI_t \)</td><td>\( IP_t \)</td><td>\( PE_t \)</td><td></td><td></td></tr><tr><td>\( Ret_t \)</td><td>1</td><td>0.55</td><td>0.43</td><td>0.35</td><td>0.59</td><td>0.02</td><td>-0.05</td><td>-0.03</td><td>0.14</td><td></td><td></td></tr><tr><td>\( S_t^{PCA} \)</td><td>0.55</td><td>1</td><td>0.80</td><td>0.90</td><td>0.72</td><td>-0.10</td><td>-0.12</td><td>-0.01</td><td>0.07</td><td></td><td></td></tr><tr><td>\( TURN_t^O \)</td><td>0.43</td><td>0.80</td><td>1</td><td>0.63</td><td>0.29</td><td>-0.15</td><td>-0.12</td><td>-0.03</td><td>-0.17</td><td></td><td></td></tr><tr><td>\( HAI_t^O \)</td><td>0.35</td><td>0.90</td><td>0.63</td><td>1</td><td>0.52</td><td>-0.04</td><td>-0.09</td><td>0.00</td><td>0.09</td><td></td><td></td></tr><tr><td>\( PE_t^O \)</td><td>0.59</td><td>0.72</td><td>0.29</td><td>0.52</td><td>1</td><td>-0.07</td><td>-0.08</td><td>0.02</td><td>0.26</td><td></td><td></td></tr><tr><td>\( CCI_t \)</td><td>0.02</td><td>-0.10</td><td>-0.15</td><td>-0.04</td><td>-0.07</td><td>1</td><td>0.16</td><td>0.28</td><td>0.66</td><td></td><td></td></tr><tr><td>\( BCI_t \)</td><td>-0.05</td><td>-0.12</td><td>-0.12</td><td>-0.09</td><td>-0.08</td><td>0.16</td><td>1</td><td>0.67</td><td>-0.09</td><td></td><td></td></tr><tr><td>\( IP_t \)</td><td>-0.03</td><td>-0.01</td><td>-0.03</td><td>0.00</td><td>0.02</td><td>0.28</td><td>0.67</td><td>1</td><td>0.09</td><td></td><td></td></tr><tr><td>\( PE_t \)</td><td>0.14</td><td>0.07</td><td>-0.17</td><td>0.09</td><td>0.26</td><td>0.66</td><td>-0.09</td><td>0.09</td><td>1</td><td></td><td></td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 4 时间序列分析 # 4.1 短期收益可预测性 # 4.1.1 单因子预测性回归 单因子预测回归是文献中研究最深入、最常用的方法。因此,它构成了建立情绪与市场收益关系的基础模型。 $$ R _ {t + 1} = \alpha + \beta S _ {t} + u _ {t + 1} \tag {4.1} $$ 其中, $R_{t+1}$ 是 $t+1$ 期的市场超额收益, $S_t$ 是 $t$ 期末测量的(滞后)情绪代理变量(或其他预测变量)。作者通过评估斜率系数来检验原假设 $(H0: \beta = 0)$ ,即投资者情绪没有预测能力。 由于作者的兴趣在于对预测模型中的斜率系数进行假设检验,如果使用传统的OLS估计程序,可能会出现几个计量经济学问题。首先,当预测变量高度持久时,可能存在伪回归问题(Ferson等人,2003)。其次,当回归变量(高度)持久且其 新息项与因变量的新息项相关时,OLS方法在有限样本中会产生有偏系数,即著名的Stambaugh(1999)小样本偏差。还需注意,在本文的案例中,由于两个时间序列的新息项正相关,beta系数是向下偏误的(趋向于零)。 为妥善解决上述计量经济学问题,采用Amihud等人(2009)的多重增强回归方法(以下简称mARM)来获得情绪斜率系数的偏差减少估计。作者意识到文献中提出了多种替代的偏差减少技术,例如Amihud和Hurvich(2004)的单变量增强回归方法(以下简称uARM)和Zhu(2013)的移动块刀切法(以下简称MBJK)。 Amihud 等人(2009)的 mARM 方法通过对预测变量 St7 运行一个辅助 AR(1) 回归来进行。 $$ S _ {t + 1} = \theta^ {c} + \rho^ {c} S _ {t} + v _ {t + 1} ^ {c} \tag {4.2} $$ 其中上标c表示通过迭代Nicholls和Pope(1988)表达式获得的偏差校正估计值。 AR(1)过程的OLS回归的分析偏差。根据Amihud等人(2009),预测回归中斜率系数β的偏差减少估计量是通过用偏差校正误差项 $\nu_{t + 1}^{\mathrm{c}}$ (从方程(4.2)中的辅助AR(1)回归获得)增强方程(4.1)来实现的。斜率系数的统计显著性基于与Newey-West调整标准误相关的t统计量。 为了假设检验的稳健性,本文还分别报告了基于Huang等人(2014)使用的野生自助法(wild bootstrap procedure)的经验p值。野生自助法考虑了预测变量的持久性、市场收益创新项与预测变量创新项之间的相关性,以及收益分布的一般形式(例如,厚尾)。在未报告的分析中,作者还根据Amihud和Hurvich(2004)以及Amihud等人(2009)建议的解析表达式,基于调整后的标准误进行了t检验。斜率系数显著性的结果非常相似,因此为简洁起见省略。 表3展示了预测回归的估计结果。面板A报告了使用由三个单独情绪成分构建的PCA情绪指数SPCA的基线结果。与普遍认为情绪是反向指标的观点相反,作者发现PCA情绪指数在整个样本期内是一个动量指标:滞后情绪与下个月的市场超额收益正相关,OLS斜率系数为 $1.38\%$ 。基于Newey-Westt统计量以及野生自助t统计量(参见经验p值),该正系数在 $5\%$ 的水平上统计显著。当使用mARM方法校正有限样本偏差时,斜率系数的幅度变得比OLS估计量更大。OLS估计中的向下偏差是预期的,因为收益的预测误差与投资者情绪的新息项正相关。根据Amihud等人(2009)的mARM方法,偏差调整后的斜率系数约为 $1.50\%$ 。也就是说,情绪的一个标准差上升(下降)会使下个月的预期市场收益增加(减少)约 $1.50\%$ 。回顾表2,中国月度市场超额收益的样本平均值仅为 $0.16\%$ ,因此斜率系数的幅度意味着预期超额收益的变化幅度约为其平均水平的九倍,表明强大的经济意义。似乎很诱人地将这种收益可预测性通过乘以12外推至年度基础,这表明年化值约为 $18\%$ 。然而,这似乎不合理,因为情绪是均值回复的,并且高(低)情绪水平在长期内预示着较低的收益,将在第4.2节进一步分析这一点。 整个样本期内OLS回归的R²约为 $2.95\%$ 。实证上,这与短期传统收益预测因子的解释力相当或略高(Goyal and Welch, 2008),在月度频率上,收益预测因子的典型解释力范围在 $0.3\%$ 到 $5\%$ 之间。mARM回归的R²如预期那样大幅增加,因为模型包含了来自方程(4.2)中辅助回归的新息项,这是一个同期项,显著增加了股票收益变动的解释力。 为了检验情绪的预测能力是否随时间稳定,将全样本分为两个长度大致相等的 子样本:一个从1997年到2005年,另一个从2006年到2013年。情绪的正收益可预测性在两种情况下都保持统计显著,表明在月度频率上非常稳定的预测模式。有趣的是,斜率系数的幅度在第二个子样本(2006-2013年)中似乎比第一个子样本(1997-2005年)更明显。情绪效应随时间的扩大与第二个子样本以更剧烈的市场变化(例如2006-2007年价格泡沫和2007-2008年金融危机)为特征的事实一致。 面板B报告了使用各个情绪成分作为回归变量的估计结果。结果与PCA情绪指数高度一致:TURNO、IIAO和PEO的斜率系数均具有预期的正号,并且根据经验p值显示,均在统计上显著。偏差减小后的斜率系数幅度每月在 $0.91\%$ 至 $1.77\%$ 之间,再次表明具有强大的经济显著性。OLS预测回归的 $\mathsf{R}^2$ 范围在 $1.10\%$ 到 $3.64\%$ 之间。很明显,本文构建的PCA情绪指数的预测能力直接来源于三个基础成分。尽管每个单独的成分都可以作为有效的情绪代理变量并产生显著的结果,但作者更重视构建的PCA情绪指数,因为PCA程序能够去除各个代理变量中包含的异质性噪声(Baker and Wurgler 2006, 2007)。 为了进行比较,在面板C中报告了三种替代情绪指数的估计结果。首先,等权重的朴素情绪指数SNaive具有与PCA情绪指数相似的强大预测能力。在整个样本期间,其偏差减小后的斜率系数为 $1.53\%$ 。其次,回顾面板B,似乎PE是比其他两个传统情绪代理变量更强的预测因子。为了解决基线结果主要受单一预测变量驱动的疑虑,作者构建了SExPE指数,该指数仅包含TURNO和IIAO。毫不奇怪,SExPE指数具有与SPCA指数非常相似的预测特征,尽管OLS回归的斜率系数和R²在幅度上略小:偏差调整系数为 $1.12\%$ ,在 $5\%$ 水平上显著,OLS回归的R²为 $1.70\%$ 。SExPE指数所表现出的相似可预测性证明了基线结果的稳健性,因为它们并非由包含单一情绪代理变量所驱动。最后,基于调查的情绪度量指标CCI的估计结果令人失望,因为其在OLS和mARM方法下的斜率系数实际上为零,表明完全没有收益可预测性。无法预测收益,加之其与所有其他(基于市场的)情绪代理变量的低相关性(如表2所示),对CCI作为情绪度量指标的有效性提出了挑战。事实上,CCI可能是一个拙劣的投资者情绪度量指标,原因有多方面。首先,根据定义,CCI衡量的是消费者对经济整体前景的普遍预期,而非对股票市场的预期。其次也是更关键的是,作为一项基于调查的度量,总存在“言行不一”的担忧,即调查受访者并不完全按照他们在调查中所指示的方式行事。另一个担忧是,CCI可能反映的是理性预期,而非情绪投资者的非理性信念。因此,所有这些事实都让人怀疑CCI在应用中作为有效情绪代理变量的适用性。 # 图表5表3:单因子预测回归结果 # Table 3 # Single-factor Predictive Regression. The table reports the estimation results of the predictive regression with single regressor. Panel A considers the PCA sentiment index for the entire sample period and two subsample periods. Panel B considers the three individual sentiment composites (all orthogonalized to macro effects): Turnover ratio $(\text{TURN}_t^O)$ , the number of newly opened investor accounts in Shanghai Stock Exchange $(IIA_t^O)$ , and the value-weighted PE ratio $(PE_t^O)$ . Panel C considers three alternative sentiment indexes. The first one is the equal-weighted naive sentiment index (denoted as $S_t^{Naive}$ ), the second is the PCA sentiment index excluding $PE_t^O$ as a component (denoted as $S_t^{ExPE}$ ), and the third one uses consumer confidence index $(CCI_t)$ , a survey-based index. For each predictor variable, we report the slope coefficients obtained from both the OLS method (first line) and the mARM method (second line). *, **, and *** stand for significance at the 10%, 5% and 1% level, based on Newey-West t-statistics. <table><tr><td></td><td>Beta</td><td>t-stat</td><td>p-value</td><td>Empirical p-value</td><td>R2</td></tr><tr><td colspan="6">Panel A: PCA sentiment index, entire sample</td></tr><tr><td>OLS</td><td>0.0138**</td><td>2.55</td><td>0.0115</td><td>0.0150</td><td>2.95%</td></tr><tr><td>mARM</td><td>0.0150***</td><td>3.32</td><td>0.0011</td><td>0.0135</td><td>38.98%</td></tr><tr><td colspan="6">Subsample 1: July 1997–December 2005</td></tr><tr><td>OLS</td><td>0.0089**</td><td>2.42</td><td>0.0174</td><td>0.0375</td><td>1.73%</td></tr><tr><td>mARM</td><td>0.0112***</td><td>3.25</td><td>0.0016</td><td>0.0980</td><td>47.52%</td></tr><tr><td colspan="6">Subsample 2: January 2006–December 2013</td></tr><tr><td>OLS</td><td>0.0169*</td><td>1.90</td><td>0.0608</td><td>0.0480</td><td>3.44%</td></tr><tr><td>mARM</td><td>0.0194**</td><td>2.52</td><td>0.0133</td><td>0.0320</td><td>34.57%</td></tr><tr><td colspan="6">Panel B: Individual composites of sentiment index, entire sample</td></tr><tr><td colspan="6">TURNT0</td></tr><tr><td>OLS</td><td>0.0085**</td><td>2.18</td><td>0.0303</td><td>0.0295</td><td>1.10%</td></tr><tr><td>mARM</td><td>0.0091**</td><td>2.39</td><td>0.0178</td><td>0.0790</td><td>20.59%</td></tr><tr><td colspan="6">IIAT0</td></tr><tr><td>OLS</td><td>0.0105</td><td>1.61</td><td>0.1100</td><td>0.0800</td><td>1.70%</td></tr><tr><td>mARM</td><td>0.0111*</td><td>1.87</td><td>0.0636</td><td>0.0480</td><td>13.99%</td></tr><tr><td colspan="6">PE0</td></tr><tr><td>OLS</td><td>0.0154***</td><td>3.15</td><td>0.0019</td><td>0.0050</td><td>3.64%</td></tr><tr><td>mARM</td><td>0.0177***</td><td>5.69</td><td>0.0000</td><td>0.0065</td><td>64.40%</td></tr><tr><td colspan="6">Panel C: Alternative sentiment index, entire sample</td></tr><tr><td colspan="6">StNaive</td></tr><tr><td>OLS</td><td>0.0141***</td><td>2.63</td><td>0.0092</td><td>0.0170</td><td>2.59%</td></tr><tr><td>mARM</td><td>0.0153***</td><td>3.55</td><td>0.0005</td><td>0.0125</td><td>41.15%</td></tr><tr><td colspan="6">StExPE</td></tr><tr><td>OLS</td><td>0.0105**</td><td>2.19</td><td>0.0295</td><td>0.0340</td><td>1.70%</td></tr><tr><td>mARM</td><td>0.0112**</td><td>2.42</td><td>0.0165</td><td>0.0525</td><td>21.54%</td></tr><tr><td colspan="6">CCIt</td></tr><tr><td>OLS</td><td>-0.0003</td><td>-0.05</td><td>0.9615</td><td>0.9900</td><td>0.00%</td></tr><tr><td>mARM</td><td>0.0003</td><td>0.04</td><td>0.9651</td><td>0.8900</td><td>0.35%</td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 4.1.2 多因子预测性回归 注意到,可能会有批评认为投资者情绪的预测能力主要是由商业或经济周期驱动的基本面变化所体现。为缓解这一担忧,首先采用几个宏观经济变量,包括商业周期指标(BCI)、工业生产总值(IP)和汇总(市值加权)市盈率(PE),作为经济基本面的有效代理变量。然后,通过多元预测回归来检验在控制这些基本面效应后,情绪的回报可预测性是否稳健。遵循文献惯例,基于情绪指数 $S_t^{PCA}$ 和控制变量向量 $Z_t$ 进行以下多因子预测回归。 $$ R _ {t + 1} = \alpha + \beta S _ {t} ^ {P C A} + \psi^ {\prime} Z _ {t} + \varepsilon_ {t + 1} \tag {4.3} $$ 再次,兴趣在于斜率系数 $\beta$ ,它衡量了在控制变量效应后,(滞后)情绪水平对后续市场回报的边际效应。 表4中的前三个模型报告了基于双变量预测回归的偏差调整mARM估计结果,其中每次包含PCA情绪指数和一个经济变量。横跨三个模型规格,情绪指数上的斜率系数β非常稳健,因为它具有相同的正号,且幅度在所有三种情况下大致相似,范围从 $1.34\%$ 到 $1.52\%$ ,这一结果与单变量回归高度相似。双变量回归中的一致结 果证实,情绪的回报可预测性并非纯粹由基本面变化(如商业周期、工业扩张和市场估值效应)所致。 表4的最后一行报告了所谓的“厨房水槽”模型(Kitchen Sink model)的结果,其中同时包含情绪和三个经济变量。厨房水槽模型的优点是可以增加预测回归的解释力。然而,缺点是高度参数化的模型与可能高度相关的回归变量可能遭受过参数化问题。再次,发现一个非常相似且一致的模式: $\mathsf{S}_{\mathrm{t}}^{\mathsf{PCA}}$ 上的偏差调整斜率系数显著为正且幅度大( $1.39\%$ ),这与表3中单预测变量回归的情况非常相似。IP和PE上的斜率系数似乎也通过Newey-West统计量显著。然而,当检查由野生自助法检验程序生成的经验p值时,只有 $\mathsf{S}_{\mathrm{t}}^{\mathsf{PCA}}$ 上的斜率系数是统计显著的。总之, $\mathsf{S}_{\mathrm{t}}^{\mathsf{PCA}}$ 的增量预测效应非常稳健,因为在所有四个模型规格下控制宏观基本面后,它仍然在统计和经济上显著。 The table reports the output of the multi-variate predictive regressions under alternative model specifications. Specification 1 to 3 are bivariate predictive regressions which estimate the sentiment effect while controlling for the effect of business cycle $(BCI_{t})$ , the growth of the industrial production $(IP_{t})$ , and the marketwide PE ratio $(PE_{t})$ . Specification 4 is the kitchen sink model which includes all the three control variables simultaneously. For brevity, we report only the slope coefficients estimated from the mARM method. *, **, and *** stand for significance at the 10%, 5% and 1% level, based on Newey-West t-statistics. 图表6表4:多因子预测回归结果 Table 4 Multiple-factor Predictive Regression. <table><tr><td>mARM</td><td>Beta</td><td>t-stat</td><td>p-value</td><td>Empirical p-value</td><td>\( R^2 \)</td></tr><tr><td colspan="6">Specification 1</td></tr><tr><td>\( S_t^{PCA} \)</td><td>0.0144***</td><td>3.67</td><td>0.0003</td><td>0.0115</td><td>40.11%</td></tr><tr><td>\( BCI_t \)</td><td>0.0000</td><td>0.01</td><td>0.9883</td><td>0.4890</td><td></td></tr><tr><td colspan="6">Specification 2</td></tr><tr><td>\( S_t^{PCA} \)</td><td>0.0152***</td><td>3.23</td><td>0.0015</td><td>0.0115</td><td>40.80%</td></tr><tr><td>\( IP_t \)</td><td>0.0006</td><td>0.16</td><td>0.8763</td><td>0.4875</td><td></td></tr><tr><td colspan="6">Specification 3</td></tr><tr><td>\( S_t^{PCA} \)</td><td>0.0134***</td><td>4.30</td><td>0.0000</td><td>0.0235</td><td>76.49%</td></tr><tr><td>\( PE_t \)</td><td>0.0041**</td><td>2.12</td><td>0.0349</td><td>0.0310</td><td></td></tr><tr><td colspan="6">Specification 4</td></tr><tr><td>\( S_t^{PCA} \)</td><td>0.0139***</td><td>4.95</td><td>0.0000</td><td>0.0230</td><td>77.16%</td></tr><tr><td>\( BCI_t \)</td><td>-0.0018</td><td>-1.06</td><td>0.2922</td><td>0.8180</td><td></td></tr><tr><td>\( IP_t \)</td><td>-0.0057*</td><td>-1.80</td><td>0.0736</td><td>0.3565</td><td></td></tr><tr><td>\( PE_t \)</td><td>0.0099***</td><td>3.01</td><td>0.0030</td><td>0.1385</td><td></td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 4.1.3 样本外可预测性 在本小节中,作者探讨著名的Goyal and Welch (2008)提出的挑战,即一个合理的担忧:样本内分析中记录的强劲月度收益可预测性是否会延续到样本外期间。原则上,过度拟合的预测模型往往在样本内具有更好的预测表现,但这种收益可预测性在样本外无法持续。因此,样本外检验对于实时评估真正的收益可预测性最为相关,因为它避免了过度参数化问题(Goyal and Welch 2008)。样本外分析的一个相关目标也是评估偏差减少技术(如mARM、uARM和MBJK)是否能够在样本外提供增强的预测性能。 对于样本外分析,作者保留1997年至2006年作为样本内期间以参数化本文的模型,并使用剩余的七年样本外期间来评估预测性能。通常,在拥有足够的样本内观测值以可靠估计模型参数与保持相对较长的样本外期间以进行预测评估之间存在权衡。鉴于中国股市历史相对较短,不幸地限制了样本量,选择的样本外期间很好地平衡了上述权衡。此外,采用递归估计方案进行样本内模型估计,并使用以下单因子预测模型形成 $t + 1$ 期的样本外预测: $$ E _ {t} \left(R _ {t + 1}\right) = \hat {\alpha} _ {t} ^ {m} + \hat {\beta} _ {t} ^ {m} S _ {t} \tag {4.4} $$ 其中 $\alpha_{t}^{m}$ 和 $\beta_{t}^{m}$ 是使用第1期到第 $t$ 期数据递归估计的回归系数。上标 $m$ 表示获得拟合值的替代估计方法, $m \in \{\text{OLS}, \text{mARM}, \text{uARM}, \text{MBJK}\}$ 。 $\mathsf{S}_{t}$ 表示在第 $t$ 期末测量的预测变量。为避免使用全样本构建的原始PCA情绪指数中的前视偏差,方程(4.4)中使用的PCA情绪指数也每次使用截至第 $t$ 期的实时信息进行递归估计。注意预测模型也可以扩展以包含其他预测变量。 为应对 Goyal and Welch (2008)的挑战,将方程(4.4)中预测模型的样本外预测与作为基准的历史平均值进行比较。历史平均预测对应于一个常数收益模型,它是方程(4.4)中预测模型的一个嵌套版本,其中斜率系数设为零。直观上,如果潜在收益过程是由一个常数加上随机噪声生成的,那么方程(4.4)中的预测模型会产生比历史平均更嘈杂的预测,因为它估计的斜率系数总体值为零。换句话说,预期基准模型会产生比预测模型更小(或相等)的均方预测误差(MSFE)。为恰当评估这一论断,计算广泛使用的样本外 ROS2 统计量、Diebold and Mariano (1995) t 统计量以及 Clark and West (2007) 的 MSFE 调整统计量。 $R_{\mathrm{os}}^{2}$ 统计量衡量预测回归预测相对于历史平均基准的MSFE比例减少量(Campbell and Thompson 2008)。其计算如下。 $$ R _ {O S} ^ {2} = 1 - \frac {\sum_ {t = p} ^ {T - 1} \left(R _ {t + 1} - E _ {t} \left(R _ {t + 1}\right)\right) ^ {2}}{\sum_ {t = p} ^ {T - 1} \left(R _ {t + 1} - \bar {R} _ {t + 1}\right) ^ {2}} \tag {4.5} $$ 其中 $R_{t+1}$ 表示 $t+1$ 期已实现的市场超额收益, $E_t(R_{t+1})$ 是 $t$ 期末预测模型的预测值。样本内期间的长度记为 $p$ ,而 $T$ 是观测值总数。 $R_{t+1}^-$ 是 $t$ 期末计算的历史平均值(基准),如方程(4.6)所示。 $$ \bar {R} _ {t + 1} = \frac {1}{t} \sum_ {i = 1} ^ {t} R _ {i} \tag {4.6} $$ 根据构造, $R_{0s^2}$ 统计量落在 $(- \infty, 1]$ 范围内。 $R_{0s^2}$ 为正值表明预测 $E_t(R_{t+1})$ 在 MSFE 方面优于基准 $R_{t+1}$ 。 Diebold and Mariano (1995)检验(以下简称 DM 检验)评估两种预测是否提供相同的预测精度。在此情况下,检验原假设:历史平均的 MSFE 小于或等于预测回归模型的 MSFE。 类似地,Clark and West (2007)提出的MSFE调整统计量也评估原假设:历史平均的预测误差(以MSFE衡量)小于或等于预测回归模型产生的预测误差。 表5的面板A报告了使用方程(4.4)的情绪样本外预测表现。对于PCA情绪指数,OLS预测模型产生了 $3.45\%$ 的正向 $\mathsf{Ros}^2$ 统计量,表明其MSFE小于历史平均。 $\mathsf{Ros}^2$ 值变得更为正向,表明在两种替代偏差减少技术(mARM和uARM方法)下,预测性能更精确(MSFE更小),优于它们的OLS对应方法。就超额表现的统计显著性而言,DM检验统计量不显著,但使用OLS或偏差减少技术(mARM、uARM和MBJK)的四种竞争预测的CW检验统计量均在 $10\%$ 水平上显著。 为便于比较,作者还生成了一个(递归的)朴素情绪指数,该指数对三个组合指标施加等权重以构建情绪指数。作者发现朴素情绪指数呈现出非常相似的规律,预测模型产生的预测优于历史平均,这由 $3.54\%$ 的正向 $\mathsf{Ros}^2$ 值所揭示。使用mARM和uARM偏差减少技术的预测也优于OLS对应方法。与PCA情绪指数的发现类似,使用OLS或偏差减少技术(mARM、uARM和MBJK)的四种竞争预测的CW检验 统计量均在 $10\%$ 水平上显著。 表5的面板B报告了双变量预测回归的预测性能,其中一个预测变量固定为PCA情绪指数,另一个依次为BCI、IP或PE。向预测模型添加额外预测变量的想法是利用一个(潜在)更大的价格相关信息集。然而,缺点是包含不相关的变量可能会增加模型估计中的噪声,导致更差的预测性能。对于所有三个双变量预测模型,发现非常相似的样本外表现: $\mathsf{Ros}^2$ 值为正,表明优于历史基准。然而,仔细检查发现,没有一个 $\mathsf{Ros}^2$ 值比情绪指数作为唯一预测变量的单变量情况中的对应值更正向。预测误差(MSFE)也大于单变量情况中的对应值,并且DM检验和CW检验统计量在大多数情况下似乎也不太显著。表现较弱可能是因为经济变量(BCI、IP和PE)对后续市场回报的预测能力非常小或没有,包含它们只会给样本外预测增加额外噪声。 总结表5的发现,作者找到了强有力的证据表明投资者情绪能够样本外预测后续市场回报。在许多情况下,样本外预测能力可以通过偏差减少技术进一步改善,特别是mARM方法,这也与前面小节的发现一致。 # 图表7表5:样本外预测表现 The table reports the out-of-sample performance of various predictors in predicting subsequent market returns. The out-of-sample forecasts are formed using fitted valued of the slope coefficients from OLS, mARM, uARM, and MBJK estimation methods, respectively. Panel A considers the case of univariate predictive regression with either the PCA sentiment index or the naive (equal-weighted) sentiment index as the predicting variable. Panel B considers the bivariate case with the PCA sentiment as one of the predictors, and another control variable as Business cycle indicator $(BCI_{t})$ , growth of industrial production $(IR_{t})$ , and PE ratio $(PE_{t})$ respectively. All of the sentiment variables and model parameters are estimated recursively based on information prior to the forecast period. $R_{OS}^{2}$ is the Campbell and Thompson (2008) out-of-sample $R^2$ , MSFE is the mean squared forecast error, DM-test is the Diebold and Mariano (1995) test statistic, and CW-test is the Clark and West (2007) MSFE-adjusted statistic. *, **, and *** stand for significance at the 10%, 5% and 1% level. The out-of-sample period ranges from January 2007 to December 2013. Table 5 Out-of-sample Forecast Performance. <table><tr><td>Method (Variables)</td><td>MSFE</td><td>\( R_{\hat{OS}}^2 \)</td><td>DM-test</td><td>CW-test</td></tr><tr><td colspan="5">Panel A: Univariate Predictive Regression</td></tr><tr><td>OLS (\( S_t^{PCA} \))</td><td>0.00849</td><td>3.45%</td><td>0.79</td><td>1.33*</td></tr><tr><td>mARM (\( S_t^{PCA} \))</td><td>0.00845</td><td>3.89%</td><td>0,79</td><td>1.39*</td></tr><tr><td>uARM (\( S_t^{PCA} \))</td><td>0.00846</td><td>3.82%</td><td>0,79</td><td>1.38*</td></tr><tr><td>MBJK (\( S_t^{PCA} \))</td><td>0.00851</td><td>3.25%</td><td>0,70</td><td>1.29*</td></tr><tr><td>OLS (\( S_t^{Naive} \))</td><td>0.00848</td><td>3.54%</td><td>0.78</td><td>1.35*</td></tr><tr><td>mARM (\( S_t^{Naive} \))</td><td>0.00845</td><td>3.96%</td><td>0.78</td><td>1.41*</td></tr><tr><td>uARM (\( S_t^{Naive} \))</td><td>0.00845</td><td>3.90%</td><td>0.78</td><td>1.40*</td></tr><tr><td>MBJK (\( S_t^{Naive} \))</td><td>0.00850</td><td>3.34%</td><td>0.70</td><td>1.31*</td></tr><tr><td colspan="5">Panel B: Bivariate Predictive Regression</td></tr><tr><td>OLS (\( S_t^{PCA},BCI_t \))</td><td>0.00850</td><td>3.40%</td><td>0.77</td><td>1.39*</td></tr><tr><td>mARM (\( S_t^{PCA},BCI_t \))</td><td>0.00863</td><td>1.84%</td><td>0.37</td><td>1.23</td></tr><tr><td>uARM (\( S_t^{PCA},BCI_t \))</td><td>0.00860</td><td>2.25%</td><td>0.50</td><td>1.11</td></tr><tr><td>MBJK (\( S_t^{PCA},BCI_t \))</td><td>0.00855</td><td>2.83%</td><td>0.60</td><td>1.28*</td></tr><tr><td>OLS (\( S_t^{PCA},IP_t \))</td><td>0.00856</td><td>2.67%</td><td>0.62</td><td>1.21</td></tr><tr><td>mARM (\( S_t^{PCA},IP_t \))</td><td>0.00852</td><td>3.12%</td><td>0.64</td><td>1.29*</td></tr><tr><td>mARM (\( S_t^{PCA},IP_t \))</td><td>0.00862</td><td>1.99%</td><td>0.42</td><td>1.08</td></tr><tr><td>MBJK (\( S_t^{PCA},IP_t \))</td><td>0.00856</td><td>2.69%</td><td>0.57</td><td>1.22</td></tr><tr><td>OLS (\( S_t^{PCA},PE_t \))</td><td>0.00868</td><td>1.28%</td><td>0.27</td><td>0.97</td></tr><tr><td>mARM (\( S_t^{PCA},PE_t \))</td><td>0.00856</td><td>2.63%</td><td>0.51</td><td>1.37*</td></tr><tr><td>mARM (\( S_t^{PCA},PE_t \))</td><td>0.00863</td><td>1.84%</td><td>0.60</td><td>1.06</td></tr><tr><td>MBJK (\( S_t^{PCA},PE_t \))</td><td>0.00868</td><td>1.34%</td><td>0.29</td><td>0.93</td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 4.1.4 市场择时策略 为阐明其投资组合意义,作者提出一个简单的改进型市场择时策略,该策略基于接收到的交易信号在风险资产和无风险资产之间切换。该策略的设计符合中国的卖空约束:在每月末,如果投资者收到买入信号,他/她将在下个月持有市场投资组 合的多头头寸。否则,投资者将平仓市场投资组合,并将所得投资于无风险资产。 为进行比较,作者采用三组不同的交易信号进行市场时机操作:第一组基于滞后情绪。当情绪指数的滞后值高于零时,定义为买入信号。其背后的直觉是,只要市场情绪高于平均水平,预期后续股票回报将上升,从而在股票市场中持有多头头寸。第二组基于以情绪为预测变量的预测模型所产生的市场超额回报预测值。如果预期市场超额回报为正,则视为买入信号。最后一组是Moskowitz等人(2012)的时间序列动量策略的仅多头版本,记为TSMOM:当过去12个月(不包括最近一个月)的累计回报为正时,产生买入信号。 按照惯例,使用买入持有策略作为基准,以评估不同交易信号带来的经济收益。由于没有特别理由将持有期限制为一个月,作者还将持有期从一个月变化到十二个月。使用Jegadeesh和Titman(1993)的方法与积极投资组合,为所有大于一个月的持有期推导出单一的月度回报时间序列。同样,样本外评估期为2007年1月至2013年12月。时机策略的超额回报计算如下: 其中, $R_{t+1:t+h}$ 是持有期从 $t+1$ 月到 $t+h$ 月期间市场投资组合的实现超额回报, $\mathrm{Signal}_t$ 是在 $t$ 月末收到的交易信号。当为买入信号时, $\mathrm{Signal}_t$ 等于 1,否则为 0。 表6的面板A和B分别报告了基准买入持有策略和基于各种信号的时机策略的平均回报和夏普比率。有几点观察值得注意。首先,基准买入持有策略在整个评估期内出现亏损:年化平均超额回报为 $-1.40\%$ ,其对应的夏普比率为-0.04。然而,这并不令人惊讶,因为评估期包含了近期全球金融危机,当时中国股市也暴跌。 其次,基于滞后情绪信号的市场时机策略(第二行)在一个月持有期内实现了惊人的 $10.75\%$ 的年化超额回报,其夏普比率为0.52,远优于买入持有策略。观察不同的持有期,当持有期在二至五个月之间变化时,投资组合表现(即超额回报和夏普比率)有进一步改善。类似地,基于情绪模型生成的预测超额回报的策略(接下来四行)也表现出色,一个月持有期的平均年化超额回报在 $4.75\%$ 至 $5.95\%$ 之间。观察不同持有期,将持有期设定在二至四个月似乎是最优的,因为在这些持有期内夏普比率通常更好。 第三,相比之下,Moskowitz等人(2012)的时间序列动量策略的仅多头版本仅实现了 $0.11\%$ 的年化超额回报,尽管它仍然优于基准买入持有策略。当持有期为两个月时,TSMOM策略确实改善至 $3.12\%$ ,但总体而言,其表现远差于基于情绪信号或基于情绪的回报信号的策略。然而,TSMOM策略在样本外测试中的表现不佳与文献中的近期证据一致。 首先,Georgopoulou and Wang (2016) 发现 TSMOM 策略在近期危机期间在多个发达和新兴市场失效。其次,Kim 等人(2016)发现 TSMOM 的利润主要源于 Moskowitz 等人(2012)论文中采用的风险平价方法(波动率方案)。在考虑波动率方案后,他们得出结论,TSMOM 策略的表现与买入持有策略无法区分。 基于情绪的市场时机策略在评估期内表现优于TSMOM策略,这一事实强化了使用投资者情绪预测市场回报的优越性。也就是说,滞后投资者情绪是比滞后回报更强有力的回报预测因子。毕竟,过去回报是未来市场走势的嘈杂信号(Levine and Pedersen 2016)。更重要的是,这也引出了另一点:从情绪信号中提取的信息内容并未被滞后回报的动态所包含,因为依赖回报自相关的TSMOM策略在危机时期受到挑战(Moskowitz等人,2012;Georgopoulou and Wang,2016)。 表6的面板C通过估计增强的Fama-French四因子模型,为市场时机策略的风险调整后表现提供了更多见解。为简洁起见,作者仅分别报告了基于滞后情绪值的时机策略和TSMOM策略的混合回归结果。就目前而言,基于滞后情绪的时机策 略获得了每月 $0.85\%$ 的风险调整回报,在 $5\%$ 的水平上显著。此外,该策略在市场因子和价值因子上的载荷分别为 $1\%$ 和 $10\%$ 的显著性水平上为正。有趣的是,动量因子上的系数为负,这提供了额外的证据,表明“情绪”影响并非主要由过去的回报动态所驱动。 相比之下,TSMOM策略获得了 $0.40\%$ 的风险调整回报,在统计上不显著。该策略在市场、价值和动量因子上的载荷显著。动量因子上的正载荷与早期发现一致,即横截面和时间序列动量策略的回报高度正相关(Moskowitz等人,2012)。 总结表6的结果,作者发现一致的证据表明,投资者情绪在月度频率上是一个强劲的动量信号,当其基于情绪相关交易信号实施市场时机策略时,其预测能力可以转化为显著的经济收益。 图表8表6:交易策略 Panel A and B reports the annualized mean returns and Sharpe ratios, respectively, for the buy-and-hold strategy (denoted as B & H) and the long-only market timing strategy using different buy signals. $S_{t}^{PCA}$ denotes the timing strategy based on the buy signal when the lagged sentiment is above zero. OLS ( $S_{t}^{PCA}$ ), mARM ( $S_{t}^{PCA}$ ), mARM ( $S_{t}^{PCA}$ ), and MBJK ( $S_{t}^{PCA}$ ) denote the buy signals when the predicted excess return generated by the different estimation techniques (OLS, mARM, uARM, and MBJK) are above zero, respectively. TSMOM denotes the long-only time-series momentum strategy with the buy signal when the lagged twelve-month return (excluding the most recent month) exceeds zero. Panel C reports the Fama-French four-factor model regression results for the time-series momentum strategy and the timing strategy using the buy signal when the lagged sentiment is above zero. The out-of-sample evaluation period is from January 2007 to December 2013. *, **, and *** stand for significance at the 10%, 5% and 1% level. Table 6 Trading Strategies. <table><tr><td colspan="13">Panel A: Annualized Mean Return (%)</td></tr><tr><td>Holding period =</td><td>1</td><td>2</td><td>3</td><td>4</td><td>5</td><td>6</td><td>7</td><td>8</td><td>9</td><td>10</td><td>11</td><td>12</td></tr><tr><td>B & H</td><td>-1.40</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td></tr><tr><td>StPCA</td><td>10.75</td><td>12.59</td><td>13.30</td><td>12.84</td><td>11.13</td><td>10.27</td><td>10.04</td><td>9.54</td><td>7.69</td><td>6.88</td><td>6.34</td><td>5.04</td></tr><tr><td>OLS (StPCA)</td><td>4.75</td><td>7.92</td><td>8.13</td><td>9.25</td><td>6.81</td><td>6.27</td><td>6.40</td><td>5.48</td><td>3.59</td><td>2.63</td><td>2.57</td><td>1.30</td></tr><tr><td>mARM (StPCA)</td><td>5.95</td><td>10.81</td><td>10.24</td><td>10.70</td><td>8.57</td><td>7.68</td><td>7.72</td><td>6.79</td><td>5.21</td><td>4.01</td><td>3.78</td><td>2.31</td></tr><tr><td>uARM (StPCA)</td><td>5.95</td><td>10.81</td><td>10.24</td><td>10.70</td><td>8.57</td><td>7.68</td><td>7.72</td><td>6.79</td><td>5.21</td><td>4.01</td><td>3.78</td><td>2.31</td></tr><tr><td>MBJK (StPCA)</td><td>4.75</td><td>7.92</td><td>8.13</td><td>9.25</td><td>6.81</td><td>6.27</td><td>6.40</td><td>5.48</td><td>3.59</td><td>2.63</td><td>2.57</td><td>1.30</td></tr><tr><td>TSMOM</td><td>0.11</td><td>3.12</td><td>1.00</td><td>-0.29</td><td>-0.70</td><td>-0.98</td><td>-2.02</td><td>-2.54</td><td>-2.85</td><td>-2.82</td><td>-2.90</td><td>-2.84</td></tr><tr><td colspan="13">Panel B: Annualized Sharpe Ratio</td></tr><tr><td>Holding period =</td><td>1</td><td>2</td><td>3</td><td>4</td><td>5</td><td>6</td><td>7</td><td>8</td><td>9</td><td>10</td><td>11</td><td>12</td></tr><tr><td>B & H</td><td>-0.04</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td><td>-</td></tr><tr><td>StPCA</td><td>0.52</td><td>0.64</td><td>0.67</td><td>0.65</td><td>0.56</td><td>0.52</td><td>0.52</td><td>0.50</td><td>0.40</td><td>0.36</td><td>0.33</td><td>0.27</td></tr><tr><td>OLS (StPCA)</td><td>0.21</td><td>0.37</td><td>0.37</td><td>0.44</td><td>0.32</td><td>0.29</td><td>0.30</td><td>0.26</td><td>0.17</td><td>0.12</td><td>0.12</td><td>0.06</td></tr><tr><td>mARM (StPCA)</td><td>0.26</td><td>0.52</td><td>0.48</td><td>0.51</td><td>0.41</td><td>0.37</td><td>0.38</td><td>0.33</td><td>0.25</td><td>0.20</td><td>0.19</td><td>0.11</td></tr><tr><td>uARM (StPCA)</td><td>0.26</td><td>0.52</td><td>0.48</td><td>0.51</td><td>0.41</td><td>0.37</td><td>0.38</td><td>0.33</td><td>0.25</td><td>0.20</td><td>0.19</td><td>0.11</td></tr><tr><td>MBJK (StPCA)</td><td>0.21</td><td>0.37</td><td>0.37</td><td>0.44</td><td>0.32</td><td>0.29</td><td>0.30</td><td>0.26</td><td>0.17</td><td>0.12</td><td>0.12</td><td>0.06</td></tr><tr><td>TSMOM</td><td>0.00</td><td>0.14</td><td>0.05</td><td>-0.01</td><td>-0.03</td><td>-0.04</td><td>-0.09</td><td>-0.11</td><td>-0.13</td><td>-0.12</td><td>-0.13</td><td>-0.12</td></tr><tr><td colspan="13">Panel C: Fama-French 4-factor Regression</td></tr><tr><td></td><td>Intercept</td><td>RMRF</td><td>SMB</td><td>HML</td><td>WML</td><td colspan="7">adj.R2</td></tr><tr><td>StPCA</td><td>0.85**</td><td>0.47***</td><td>-0.09</td><td>0.24*</td><td>-0.19</td><td colspan="7">0.65</td></tr><tr><td>t-stat</td><td>2.21</td><td>5.00</td><td>-1.01</td><td>1.91</td><td>-1.49</td><td colspan="7"></td></tr><tr><td>TSMOM</td><td>0.40</td><td>0.54***</td><td>-0.11</td><td>0.35***</td><td>0.38***</td><td colspan="7">0.63</td></tr><tr><td>t-stat</td><td>1.04</td><td>3.69</td><td>-0.77</td><td>2.83</td><td>2.71</td><td colspan="7"></td></tr></table> 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 4.2 长期收益可预测性 # 4.2.1 长周期预测回归 在本小节中,作者将重点转向投资者情绪的长期预测能力。迄今为止,实证文献已提供有力证据表明市场情绪在长期内是一个反向收益预测指标(Baker and Stein 2004; Brown and Cliff 2005; Baker et al. 2012)。这类文献通常采用以下多期预测回归模型: $$ R _ {t + 1: t + h} = \alpha + \beta S _ {t} + u _ {t + 1: t + h} \tag {4.8} $$ 其中 $R_{t+1:t+h}$ 是从 $t+1$ 期到 $t+h$ 期累计(或平均)的超额收益, $S_t$ 是在 $t$ 期末测量的 $h$ 期滞后预测变量(例如情绪代理变量)。检验的原假设 $(H0: \beta = 0)$ 是预测变量没有预测能力。 例如,Huang等人(2014)发现投资者情绪在1个月至12个月的期限内负向预测未来市场收益。他们将长期情绪效应的实证模式归因于经典的有限套利行为学论点。从长期来看,市场会逐渐纠正错误定价,因为它无法在短时间内消除错误定价。类似地,Schmeling(2009)提供了跨越18个发达经济体的国际证据,表明投资者情绪在1个月、6个月、12个月和24个月的期限上都是反向预测指标。 尽管金融市场中情绪长期反向预测能力的证据日益增多,然而上述估计方法及其相关结果并非没有重大争议(Boudoukh et al. 2008)。为克服使用重叠收益作为因变量以及预测变量持续性水平所带来的问题,选择另一种途径来研究投资者情绪收益可预测性的期限结构。具体来说,考虑以下预测回归模型,收益期限范围从1个月到60个月。 其中 $R_{t + h}$ 是 $t + h$ 期的市场超额收益, $S_t$ 是在 $t$ 期末测量的 $h$ 期滞后预测变量(情绪代理变量)。还加入了一个常规宏观变量向量以控制基本面的变化。额外的控制变量包括商业周期指标(BCI)、工业生产总值(IP)和汇总PE比率,类似于第4.1.2小节。作者再次通过评估斜率系数来检验原假设 $(H0:\beta = 0)$ ,即投资者情绪没有预测能力。 图2描绘了使用PCA情绪指数作为收益预测变量,在不同时间范围(1至60个月)的预测回归中得到的t统计量。为稳健起见,作者报告了不同估计技术(OLS, mARM, uARM, MBJK)下的估计结果。仔细研究这四张图可揭示以下模式。首先,市场情绪在短期内(例如第一年)是一个强劲的动量信号。前八个月的t统计量均为正值,其中三个在 $5\%$ 的水平上显著。动量趋势在滞后1个月、2个月和7个月时最为明显。其次,紧接短期动量模式之后,t统计量在随后的月份(即从第9个月到第21个月)转为负值并变得更为显著。斜率系数符号的变化表明情绪在后续时期转变为反向预测指标。此外,从第9个月到第60个月,作者发现大多数t统计量(52个中有36个)为负值,表明市场情绪在长期内负向预测市场收益。特别是,期限结构远端(从第47个月到第60个月)的t统计量全部为负,其中有六个在 $10\%$ 的水平上显著,这强化了Baker and Wurgler(2007)提出的观点,即情绪的反向可预测性与随时间推移的市场修正有关。 图表9图2:不同方法下多期可预测性规律 Fig. 2. Multi-horizon Predictability Pattern under Alternative Estimation Methods. The figure depicts the $t$ -statistics of the slope coefficients in the multihorizon predictive regression under alternative estimation methods. Panel A to D represent the OLS, mARM, uARM, and MBJK methods, respectively. We regress the monthly excess return of the total market on the lagged sentiment index over various horizons. The horizons (month lags) vary from one month to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 在未报告的稳健性检验中,本文还分别测试了三个情绪成分 (TURNt,O,IIAtO 和 $\mathsf{PE}_{\mathsf{t}}^{\mathsf{O}}$ )的多期预测模式。作者再次发现了非常相似的模式,即情绪代理变量从短期动量预测指标转变为长期反向预测指标。事实上,对于某些情绪代理变量(例如 $\mathsf{TURN}_{\mathsf{t}}^{\mathsf{O}}$ ),其短期动量模式持续的时间甚至比PCA情绪指数的八个月更长。 总而言之,作者使用不同的情绪代理变量和替代估计方法,发现了一个非常显著且稳健的期限结构。即,投资者情绪从主要在一年内的动量预测指标,转变为相对较长时期(大约从第二年开始)的反向预测指标,这与第2节中提出的短期动量假说和长期反向假说是一致的。 # 4.2.2全球情绪的影响 在本小节中,作者进一步研究全球情绪对A股市场的传染效应。先前文献表明,情绪会在市场间传播,因为国家层面的情绪是相互正相关的(Baker et al. 2012)。Baker等人(2012)使用面板回归,将月度国家层面收益对年初的全球和本地情绪进行回归,发现强有力的证据表明全球情绪是国家层面收益的反向预测指标。然而,在控制了来自全球情绪的溢出效应后,本地情绪的时间序列效应变得微不足道。 应注意,只有合格境外机构投资者(QFII)能够投资中国A股市场,对国际投资者市场参与的限制削弱了本地情绪与全球情绪之间的联系。因此,在样本期内,基于市场的情绪指数与美国情绪指数的相关性略为负值,为 $-13.5\%$ (见图3)。因此,来自发达经济体的关于全球情绪的先前证据可能对新兴市场具有误导性。全球情绪是否以及如何溢出到中国本地市场,仍然是一个有趣但尚未探索的实证问题。为建 立中国股票收益与全球情绪之间的联系,估计了以下增强的长周期预测模型。 图表10图3:本土和全球投资者情绪指数 Fig. 3. Local and Global Investor Sentiment during the Sample Period: 1997-2010. The red line depicts the local investor sentiment, proxied by the PCA sentiment index, while the blue line depicts the global sentiment, proxied by the US sentiment index by Baker and Wurgler (2006). Both time-series are restandardized to have mean zero and unit variance during the common period from July 1997 to December 2010. (For interpretation of the references to color in this figure legend, the reader is referred to the web version of this article). 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 $$ R _ {t + h} = \alpha + \beta_ {1} S _ {t} ^ {\text {L o c a l}} + \beta_ {2} S _ {t} ^ {\text {G l o b a l}} + \psi^ {\prime} Z _ {t} + u _ {t + h} \tag {4.10} $$ 其中 $R_{t + h}$ 是 $t + h$ 期间的月度市场超额收益, $S_t^{Local}$ 是在 $t$ 期末测量的(滞后)本地情绪。在本文的分析中,作者再次使用 PCA 情绪指数。对于(滞后)全球情绪指数 $S_t^{Global}$ ,作者使用 Baker and Wurgler(2007)的美国情绪指数作为有效代理变量。遗憾的是,美国情绪指数于 2010 年底结束,这缩短了本文分析的样本量。两个情绪指数在估计期间都经过重新标准化,使其均值为零、方差为一,以便于解释经济相关性。作者再次检验这些情绪指数上的斜率系数在统计上是否显著异于零。 图4和图5分别描绘了使用OLS和mARM估计方法进行多期预测回归后,本地和全球情绪指数的t统计量。两种估计方法下的实证模式非常相似。首先,本地PCA情绪指数的多期预测模式与图2中的模式相比基本保持不变:它在短期内是强劲的动量预测指标,并逐渐在长期内转变为反向信号。其次,也更有趣的是,作者发现全球情绪确实对中国股市有显著影响。然而,全球情绪的影响并非立竿见影,因为在前两年内, $\mathsf{S}_{\mathrm{t}}^{\mathrm{Global}}$ 上的斜率系数没有一个在 $5\%$ 的水平上显著。大约两年后,全球情绪似乎确实成为本地股市的一个警示信号。全球情绪带来的剧烈负面影响主要集中在三到四年的期限上。还应指出,加入全球情绪也提高了模型的解释力,这体现在与单变量对应模型(未报告)相比, $\mathsf{R}^2$ 值有所增加。总体而言,作者证实了Baker等人(2012)的发现,即情绪会在市场间传播,并且全球情绪在长期内是国家层面收益的反向预测指标。 图表11图4:本土和全球情绪的多周期可预测性规律 Fig. 4. Multi-horizon Predictability Patterns of the Local and Global Sentiment, OLS and mARM method. The figure depicts the $t$ -statistics of the slope coefficients on the local and global sentiment indices, respectively. We use both OLS and mARM methods in the multi-horizon predictive regression. The horizons (month lags) vary from one month up to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 # 5 横截面分析 # 5.1 按规模排序的投资组合 尽管本文主要关注聚合的市场层面,但也在样本期内对横截面上的情绪影响进行了一些探讨。Lee等人(1991)认为投资者情绪更多是一个规模故事:小公司比大公司受到的影响更大,这一观点后来被其他研究证实(Baker and Wurgler 2006, 2007; Baker et al. 2012; Stambaugh et al. 2012)。 考虑到中国个人投资者强大的市场力量,使用市值作为情绪敏感性的有效代理变量,并检验投资者情绪在横截面上的预测能力是合理的。因此,我们根据市值在第30和第70百分位的经验分界点,将股票分类为大盘、中盘和小盘投资组合。也就是说,大盘股代表对情绪免疫的股票,而小盘股代表易受情绪影响的股票。我们应该指出,如果情绪确实对小公司的影响大于大公司,预计会发现短期动量信号对小公司更为明显,因为这些公司更容易受到非理性情绪的影响,使得套利消除情绪引致的错误定价更加困难。 为确定情绪的横截面效应,采用与方程(4.9)相同的预测回归框架,只是将因变量替换为三个按规模排序的投资组合的月度超额收益序列,以及一个零成本投资组合(做多小盘股并做空大盘股)的收益。作者再次基于斜率系数的显著性,检验原假设 $(\mathsf{H0}:\beta = 0)$ ,即投资者情绪没有预测能力。 图 5 和图 6 分别报告了使用 OLS 和 mARM 估计方法,在不同时间范围(1 至 60 个月)的预测回归中,斜率系数的 t 统计量。总结这两张图,作者观察到若干实 证模式。首先,可以确信(本地)投资者情绪在短期内是三个按规模排序的投资组合的可靠动量信号。其次,短期动量效应似乎对小规模公司比大规模公司更重要,因为在第一年内有更多显著为正的t统计量。此外,规模投资组合的斜率系数幅度从大盘股到小盘股单调递增,而R²值也单调上升。第三,虽然市场情绪在长期内是反向预测指标,但负面影响从大盘股到小盘股逐渐减弱。换句话说,强劲的正向时间序列可预测性对小盘股比大盘股更为明显且持续更长时间。最后,也是最引人注目的是,作者发现使用零成本投资组合收益(作为因变量)的回归,其斜率系数的t统计量在60个月的预测期内大多为正值。也就是说,高情绪意味着在未来投资期限中存在较高的规模溢价。这种显著的横截面差异与发达市场中关于情绪效应的反向可预测性的现有发现相悖。然而,归根结底,作者确认了情绪是一个规模故事。这强化了我们的推测,即从市场情绪中提取的动量信号在中国小公司中比在大公司中更为明显。考虑到中国严格的卖空约束,似乎可以合理地认为,小公司更容易受到非理性情绪信念的影响,并且与大盘股相比,更难通过套利消除情绪引致的错误定价。 图表12图5:基于OLS的多期横截面可预测性规律 Fig. 5. Multi-horizon Predictability Patterns in the Cross Section, OLS Method. The figure depicts the $t$ -statistics of the slope coefficient on the sentiment index in the multi-horizon predictive regression using the OLS method. We regress the monthly excess return of the big-cap, medium-cap, small-cap, and small-minus-big portfolio on the lagged sentiment index over various horizons. The horizons (month lags) vary from one month up to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 图表 13 图 6: 基于 mARM 的多期横截面可预测性规律 Fig. 6. Multi-horizon Predictability Patterns in the Cross Section, mARM method. The figure depicts the $t$ -statistics of the slope coefficient on the sentiment index in the multi-horizon predictive regression using the mARM method. We regress the monthly excess return of the big-cap, medium-cap, small-cap, and small-minus-big portfolio on the lagged sentiment index over various horizons. The horizons (month lags) vary from one month up to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 总体而言,可以得出结论,情绪对小市值股票的影响强于对大市值股票的影响,这表明小盘股的价格可能在相对较长的投资期限内呈现出由个人投资者引发的更强劲上涨。 # 5.2 全球情绪的横截面效应 继上一小节的横截面分析之后,作者检验了全球情绪的影响在横截面上是否也存在差异。采用与方程(4.10)相同的,同时包含本地和全球情绪的预测回归框架,只是将因变量替换为三个按市值排序的投资组合的月度超额收益序列,以及一个零成本投资组合(做多小盘股并做空大盘股)的收益。由于全球情绪数据的限制,样本期限定为1997年7月至2010年12月。 图7和图8分别使用OLS和mARM估计方法,可视化了对全球情绪的斜率系数的t统计量。基于这两张图,可以总结出若干实证规律。首先,比较三个规模排序投资组合的图示,作者再次发现全球情绪并没有立竿见影的影响,但在长期内对所有规模组的股票收益产生负向影响。特别是,长期的反向可预测性集中在三至四年的期限上,这证实了全球情绪向本地市场的溢出效应,如(Baker等人,2012)所记载。 图表 14 图 7: 基于 OLS 的全球情绪的跨期可预测性规律 Fig. 7. Multi-horizon Predictability Patterns of the Global Sentiment for the Size-sorted Portfolios, OLS method. The figure depicts the $t$ -statistics of the slope coefficients on the global sentiment index in the multi-horizon predictive regression using the OLS method. We regress the monthly excess return of the big-cap, medium-cap, small-cap, and small-minus-big portfolio on the lagged local and global sentiment indexes over various horizons. The horizons (month lags) vary from one month up to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 图表 15 图 8: 基于 mARM 的全球情绪的跨期可预测性规律 Fig. 8. Multi-horizon Predictability Patterns of the Global Sentiment for the Size-sorted Portfolios, mARM method. The figure depicts the t-statistics of the slope coefficients on the global sentiment index in the multi-horizon predictive regression using the mARM method. We regress the monthly excess return of the big-cap, medium-cap, small-cap, and small-minus-big portfolio on the lagged local and global sentiment indexes over various horizons. The horizons (month lags) vary from one month up to 60 months. The plot is obtained from the entire sample period from July 1997 to December 2013. 资料来源:《Can Investor Sentiment Be a Momentum Time-Series Predictor Evidence from China》,华安证券研究所 其次,通过检验全球情绪对零成本投资组合(做多小盘股、做空大盘股)的影响来评估是否存在任何横截面差异。作者发现一些(微弱的)证据表明,全球情绪在长期内充当了规模溢价的预警信号,因为从第13个月起,t统计量大多为负值。然而,没有一个t统计量在常规的 $5\%$ 水平上显著。 总体而言,本文的发现强化了全球情绪的作用,它横跨市场并在横截面上负向预测股票收益。 # 6 讨论与