> **来源:[研报客](https://pc.yanbaoke.cn)** # 双轨最优传输分布纠偏与对抗生成式因子挖掘模型总结 ## 核心内容 本文提出了一种结合最优传输理论与生成对抗网络(GAN)的因子挖掘模型,旨在解决传统IC损失函数和深度Transformer网络在金融因子挖掘中的局限性。传统IC损失仅关注预测值的排序方向,忽视了分布形态的结构性要求,导致因子在高IC表现下仍存在尾部区分度不足与跨期不稳定的问题。而深度Transformer网络在时序特征编码中缺乏底层表征约束,容易将所有有效信号压缩至序列末端,造成潜空间漂移与过拟合。 为此,本文从两个方向进行优化:一是通过引入最优传输理论进行分布对齐,二是通过对抗生成网络实现分布度量的自适应进化。最终提出双轨对抗挖掘网络(DTAN),在因子分布拟合、多头组合收益和风险控制等方面均取得显著提升。 ## 主要观点 1. **最优传输理论**: - 最优传输(OT)问题源于土方挖掘与填充的几何问题,后被推广至概率测度空间,成为衡量分布差异的重要工具。 - Wasserstein距离具有良好的几何性质,能够有效捕捉分布差异,但计算复杂度高。 - 切片Wasserstein距离(SWD)通过随机投影降低计算复杂度,适用于高维场景,且具有理论保证。 2. **不平衡最优传输(UOT)**: - 通过引入KL散度作为软性边际约束,解决了标准OT对离群点敏感、分布规模不一致、分布偏移脆弱等问题。 - UOT模型在IC均值、多头组合年化收益等方面优于标准OT模型。 3. **对抗生成网络(GAN)**: - GAN通过生成器与判别器的对抗博弈,实现了分布匹配。 - WGAN通过引入梯度惩罚(GP)机制,解决了原始GAN中的梯度消失问题,提升了训练稳定性。 4. **双轨模型**: - **双轨Sinkhorn网络(DTSN)**:在输出轨外新增潜空间锚定轨,通过动态更新的潜特征记忆库锚定股票的跨期表现,提升模型的稳定性与泛化能力。 - **双轨对抗挖掘网络(DTAN)**:用两个WGAN-GP判别器替代固定距离度量,使分布度量在对抗博弈中自适应进化,进一步提升因子表现。 ## 关键信息 ### 模型表现对比 | 模型 | 因子IC均值 | 多头组合年化收益率 | 最大回撤 | 年化超额收益率 | |------|-------------|---------------------|----------|-----------------| | 基线模型(Transformer + IC损失) | 0.0976*** | 35.23% | 36.38% | 21.42% | | GDA模型 | 0.1045 | 38.66% | - | - | | UOA模型 | 0.1117 | 40.50% | - | - | | DTSN模型 | 0.1137 | 42.19% | - | - | | DTAN模型 | 0.1173 | 45.04% | - | - | - DTAN模型在因子IC均值、多头组合年化收益率和最大回撤控制方面表现最优。 - DTAN模型在沪深300、中证1000、国证2000指数增强策略中分别取得13.36%、24.22%、31.75%的年化超额收益率。 ### 分布拟合检验 - GDA模型在W1指标上表现最佳,分布形状拟合效果优于其他模型。 - DTAN模型在W1指标上表现次之,且在因子分布形状拟合方面优于UOA和DTSN模型。 ### 风险提示 - 所有模型表现基于历史数据,存在数据滞后性与第三方数据不准确的风险。 - 策略效果仅针对回测区间,不能保证未来表现,也不构成投资建议。 ## 模型结构与优化路径 1. **全局分布对齐模型(GDA)**: - 引入切片Wasserstein距离作为损失函数,实现预测分布与真实收益分布的几何对齐。 2. **非平衡最优传输模型(UOA)**: - 引入KL散度作为边际惩罚项,实现对离群点的鲁棒性。 - 通过条件状态感知模块,自适应调节匹配强度。 3. **双轨Sinkhorn网络(DTSN)**: - 在输出轨外新增潜空间锚定轨,通过动态更新的潜特征记忆库锚定跨时间牛股参照系。 - 强迫模型使用历史上稳定牛股模式编码股票,提升因子稳定性。 4. **双轨对抗挖掘网络(DTAN)**: - 用两个WGAN-GP判别器替代固定距离度量,实现分布度量的自适应进化。 - 通过对抗博弈,提升模型的鲁棒性与泛化能力。 ## 附录 ### 相关研究 1. T2RL:端到端深度强化学习因子挖掘与组合优化框架 (2026-04-01) 2. OpenClaw:如何改变投资研究模式 (2026-03-22) 3. BLACK-LITTERMAN模型:融合资产择时与风格轮动的资产配置研究 (2026-02-26) 4. 多周期嵌套下的多主线与风格轮动再平衡策略 (2026-01-09) 5. ESG投资现状及量化多因子策略跟踪 (2025-12-31) 6. 强化学习驱动下的解耦时序对比选股模型 (2025-12-25) 7. DAFAT:基于Transformer的自适应解决方案 (2025-08-29) 8. 加权影线频率与K线形态因子 (2025-08-28) 9. 可转债K线看跌信号与交易增强策略 (2025-06-09) 10. 基于历史K线形态的因子选股研究 (2025-05-26) ### 图表目录 - 图1: Monge映射原理示意 - 图2: GAN结构示意 - 图3: WGAN-GP结构示意 - 图4: 基线模型因子IC - 图5: 基线模型因子分组-绝对净值 - 图6: 基线模型因子分组测试-相对净值 - 图7: 基线模型因子多头分年度净值 - 图8: GDA模型因子IC - 图9: GDA模型因子分组-绝对净值 - 图10: GDA模型因子分组测试-相对净值 - 图11: GDA模型因子多头分年度净值 - 图12: UOA模型因子IC - 图13: UOA模型因子分组-绝对净值 - 图14: UOA模型因子分组测试-相对净值 - 图15: UOA模型因子多头分年度净值 - 图16: DTSN模型结构 - 图17: DTSN模型因子IC - 图18: DTSN模型因子分组-绝对净值 - 图19: DTSN模型因子分组测试-相对净值 - 图20: DTSN模型因子多头分年度净值 - 图21: DTAN模型结构 - 图22: DTAN模型因子IC - 图23: DTAN模型因子分组-绝对净值 - 图24: DTAN模型因子分组测试-相对净值 - 图25: DTAN模型因子多头分年度净值 - 图26: 不同模型因子分布与真实分布对比 - 图27: 不同模型因子分布与真实分布对比(Q-Q图) - 图28: DTAN沪深300指数增强表现 - 图29: DTAN沪深300指数增强超额滚动回撤 - 图30: DTAN沪深300指数增强表现(近一月) - 图31: DTAN沪深300指数增强表现(近三月) - 图32: DTAN沪深300指数增强表现(近一年) - 图33: DTAN沪深300指数增强表现(近三年) - 图34: DTAN中证1000指数增强表现 - 图35: DTAN中证1000指数增强超额滚动回撤 - 图36: DTAN中证1000指数增强表现(近一月) - 图37: DTAN中证1000指数增强表现(近三月) - 图38: DTAN中证1000指数增强表现(近一年) - 图39: DTAN中证1000指数增强表现(近三年) - 图40: DTAN国证2000指数增强表现 - 图41: DTAN国证2000指数增强超额滚动回撤 - 图42: DTAN国证2000指数增强表现(近一月) - 图43: DTAN国证2000指数增强表现(近三月) - 图44: DTAN国证2000指数增强表现(近一年) - 图45: DTAN国证2000指数增强表现(近三年) ### 表格目录 - 表1: 3类常见分布差异度量 - 表2: UOT相较于标准OT的改进 - 表3: 模型训练特征 - 表4: 基线模型Transformer及IC_loss模型效果 - 表5: 基线模型因子10分组表现 - 表6: 基线模型因子多头分年度超额表现 - 表7: GDA模型因子测试效果 - 表8: GDA模型因子10分组表现 - 表9: GDA模型因子多头分年度超额表现 - 表10: UOA模型因子测试效果 - 表11: UOA模型因子10分组表现 - 表12: UOA模型因子多头分年度超额表现 - 表13: DTSN模型因子测试效果 - 表14: DTSN模型因子10分组表现 - 表15: DTSN模型因子多头分年度超额表现 - 表16: DTAN模型因子测试效果 - 表17: DTAN模型因子10分组表现 - 表18: DTAN模型因子多头分年度超额表现 - 表19: 各模型因子测试效果 - 表20: 各模型因子相关性测试 - 表21: 因子分布情况测试 - 表22: 因子分布与真实收益分布不同分位点的平均绝对偏差 - 表23: 沪深300指数成分股因子测试 - 表24: 沪深300指数增强策略回测结果 - 表25: DTAN沪深300指数增强策略分区间回测结果 - 表26: 中证1000指数成分股因子测试 - 表27: 中证1000指数增强策略回测结果 - 表28: DTAN中证1000指数增强策略分区间回测结果 - 表29: 国证2000指数成分股因子测试 - 表30: 国证2000指数增强策略回测结果 - 表31: DTAN国证2000指数增强策略分区间回测结果