> **来源:[研报客](https://pc.yanbaoke.cn)** # 从线性失效到非线性重构:基于XGBoost算法的可转债选券框架再优化总结 ## 核心内容概述 本文探讨了基于XGBoost算法的可转债择券框架的再优化,重点在于因子体系的扩展与质量提升、训练窗口的选择以及模型在不同约束情景下的表现。随着市场环境的复杂化,传统线性多因子模型的局限性逐渐显现,XGBoost模型因其非线性关系识别能力,在当前转债市场定价逻辑中展现出更强的适应性。 ## 主要观点 - **市场环境变化**:2023年以来,国内利率中枢、权益风险偏好、转债估值水平及外部冲击均经历多轮切换,导致转债定价逻辑从单一因素转向多个维度的交互作用。 - **模型选择转变**:XGBoost模型相较于传统线性模型,能够识别因子之间的非线性关系与交互效应,更适合当前复杂的市场定价环境。 - **因子体系优化**:因子库从19个扩展至41个,筛选出26个核心因子,涵盖估值、动量、风险、流动性、正股属性和条款事件等维度,提升了模型对转债收益来源的覆盖能力。 - **训练窗口选择**:通过滚动窗口测试,发现3.5年训练窗口在收益弹性、风险控制和市场适配性方面表现最佳,累计收益达577.52%,最大回撤为-15.72%,胜率为56.73%。 - **模型有效性验证**:在月度调仓框架下,无约束组合年化收益率达19.66%,超额收益率达12.96%;加入价格、信用和条款约束后,组合表现依然稳健,说明模型收益并非完全依赖信用下沉。 - **因子贡献分析**:在3.5年训练窗口下,估值及性价比贡献占比最高(20.62%),其次是流动性及规模(19.13%)、波动及风险(16.52%)、条款事件(15.98%)和价格动量(14.61%),表明转债定价不仅依赖债底保护因子,还受到股性弹性、交易属性和条款博弈的影响。 ## 关键信息 - **因子扩展**:引入了转债5日、6-20日、21-60日动量,以及转债相对正股动量等交易型变量,细化强赎进度、下修进度等条款类指标。 - **模型表现**:在无约束情景下,Top20组合年化收益率达19.66%,超额收益率达12.96%;剔除高价、低评级和条款风险标的后,组合表现依然稳健。 - **训练窗口选择**:3.5年滚动窗口在收益弹性、风险控制和市场适配性之间达到最佳平衡,模型净值达到6.78,累计收益达577.52%。 - **模型适应性**:XGBoost模型在非线性关系识别和因子交互处理方面具有优势,适合用于当前复杂的转债市场定价逻辑。 - **风险提示**:模型可能存在与未来市场环境不匹配、数据误差、市场风格切换及交易成本等因素导致的阶段性失效风险。 ## 模型结构与流程 1. **数据输入**:原始数据包括价格、转股溢价率、YTM、正股动量、波动率、流动性、条款进度等多维变量。 2. **数据处理**:进行数据清洗、异常值填充、因子对齐、标准化处理及时间划分。 3. **特征工程**:构建包含估值、动量、风险、流动性、正股估值与行业、条款事件等维度的因子体系。 4. **模型训练**:采用XGBoost算法,通过多轮决策树逐步拟合目标收益,利用验证集调参。 5. **收益预测**:输出转债未来收益预测值或排序得分,用于横截面收益解释。 6. **策略输出**:根据预测得分选取Top N转债,加入价格、信用和条款约束,形成最终组合权重。 7. **效果检验**:通过RankIC、ICIR、分组收益等指标评估模型稳健性与市场适应性。 ## 回测与绩效表现 - **无约束组合**:年化收益率19.66%,年化超额收益率12.96%,各年度表现稳定。 - **约束情景表现**: - 剔除高价转债:年化收益率19.90%,波动和回撤有所收敛。 - 剔除低评级转债:年化收益率18.10%,收益并非完全来自信用下沉。 - 剔除条款风险标的:组合收益下降,表明条款事件可能是收益来源,也可能是风险因素。 - **3.5年窗口优势**:在收益弹性、风险控制和策略稳定性方面表现最优,2024年以来各年度表现均衡,未依赖单一年份。 ## 风险提示 - 模型训练窗口和参数设置可能与未来市场环境不完全匹配。 - 因子口径处理和数据统计可能存在误差。 - 市场风格快速切换或极端事件冲击可能导致模型阶段性失效。 - 转债信用风险、条款风险、流动性风险和交易成本可能影响组合实际表现。 - 历史回测结果不代表未来收益。 ## 附录与相关研究 - **模型目标函数**:XGBoost模型通过多棵决策树的迭代预测,公式为:$\hat{y}_i = \sum_{k=1}^{K} f_k(x_i)$。 - **相关研究**:包括可转债策略、利率策略、海外中央银行研究等,为模型提供了理论和实证支持。 ## 结论 优化后的XGBoost模型在因子体系、训练窗口和组合约束方面具备较强扩展价值。无约束组合适用于模型原始择券能力评估,规避高价和低评级组合适合稳健型资金,而条款风险约束组合则适合信用风险较强的投资者。整体来看,该模型更适配当前“股性弹性增强+估值分化+条款影响上升”的定价特征,因子贡献结构也验证了其在非线性框架下的适应性。