> **来源:[研报客](https://pc.yanbaoke.cn)** # 基于多因子体系的基差预测模型(二)总结 ## 核心内容 本报告在前序研究《基于多因子体系的基差预测模型》基础上,对基差预测模型进行了多方面的优化与拓展,以提升模型在不同市场环境下的适应性与预测效果。 ## 主要观点 1. **同品种不同合约基差的有效因子有显著区别** 不同合约上的交易群体和交易偏好存在差异,导致基差的有效驱动因子有所不同。近月合约更偏投机属性,远月合约更偏对冲属性。 2. **因子相关性随时间动态变化** 市场风格切换会导致基差与因子之间的相关关系发生变化,因此采用滚动因子筛选机制,以提高模型的灵活性和适应性。 3. **多模型融合提升预测效果** 结合截面因子模型与时间序列模型,构建多模型融合体系,能更好地捕捉基差的动态变化和非线性关系,提升预测的准确性与稳定性。 4. **不同合约预测效果存在差异** 近月合约因到期时间短,基差波动大,预测难度较高;远月合约因基差波动较小,预测精度和方向准确性相对更高。 5. **机器学习模型在预测精度方面表现更优** 随机森林和XGBoost等非线性模型在预测精度上优于线性模型,但时间序列模型在方向预测上表现更佳。 ## 关键信息 ### 模型优化措施 1. **因子增添与筛选** - 加入新因子,如ETF份额、市值、CFTI席位数据、波动率、收益率等。 - 构建因子相关性矩阵,去除高度相关的因子,保留与基差相关性更高的因子,提升模型稳健性。 - 根据ETF类型,区分进取型与稳健型,发现进取型ETF与基差呈负相关,稳健型ETF与基差呈正相关。 2. **滚动筛选因子** - 将固定因子池改为滚动窗口筛选,以适应市场风格的动态变化。 - 发现不同时间段下有效因子有所变化,例如2020-2022年期间超额因子影响较大,而2023-2025年期间融券余额与波动率因子成为主导。 3. **全合约预测** - 从单一合约预测拓展至全合约预测,提高模型的适用性与覆盖度。 - 不同合约的基差与因子的相关性差异显著,进一步验证了各合约上交易群体的差异。 4. **多模型融合** - 引入AR时间序列模型,结合线性回归、随机森林、XGBoost等模型,构建多模型融合预测体系。 - 各模型在不同合约上的表现差异较大,通过融合可提升整体预测效果。 ### 模型预测效果 - **IC合约**: - 各模型预测准确率在 $60\%$ 至 $66\%$ 之间。 - 多模型融合后,平均方向准确率约为 $61\%$,平均MSE约为0.0374。 - **IH合约**: - 多模型融合后,平均方向准确率约为 $62.46\%$,平均MSE约为0.0282。 - **IF合约**: - 多模型融合后,平均方向准确率约为 $61.29\%$,平均MSE约为0.0274。 - **IM合约**: - 多模型融合后,平均方向准确率约为 $60.64\%$,平均MSE约为0.0525。 ### 因子相关性分析 - **IC02合约**: - 2020-2022年期间,超额因子与基差呈显著负相关。 - 2023-2025年期间,融券余额与波动率因子对基差影响更大。 - 稳健型ETF(如规模型、风格型)与基差呈正相关,进取型ETF(如主题型、行业型)与基差呈负相关。 - **IH合约**: - 融券余额、波动率因子与基差相关性较高。 - 零售净持仓与基差呈正相关,机构净持仓与基差呈负相关。 - **IF合约**: - 波动率、持仓量、资金沉淀等因子对基差影响显著。 - 零售空头持仓与基差呈负相关,机构净持仓与基差呈负相关。 - **IM合约**: - 波动率、持仓量、资金沉淀等因子影响较大。 - 与IC、IH、IF相比,IM合约的预测效果相对较低,可能与其流动性或市场关注度有关。 ## 结论 通过加入新因子、调整因子筛选方式、拓展至全合约预测以及引入多模型融合策略,基差预测模型在不同合约与时间段的预测效果得到了显著提升。特别是时间序列模型在方向预测上表现优于其他模型,而机器学习模型在预测精度上更具优势。模型在不同合约上的表现差异表明,基差的预测需结合具体合约特性进行分析。整体来看,多模型融合策略能够有效整合各模型优势,提升预测的全面性和准确性。 ## 风险提示 - 回测结果基于历史数据,不保证未来表现。 - 市场环境变化可能导致模型失效,需持续关注并调整。 ## 免责声明 本报告基于公开信息编制,不保证其准确性与完整性。报告观点、结论及预测仅反映发布当日判断,不构成投资建议。投资者应独立判断,自行承担投资风险。本报告版权属华泰期货研究院所有,未经许可不得擅自使用或传播。