深度报告-2026-06-17-西南证券-双轨最优传输分布纠偏与对抗生成式因子挖掘模型_48页_7mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # 双轨最优传输分布纠偏与对抗生成式因子挖掘模型总结 ## 核心内容 本文提出一种结合最优传输理论与生成对抗网络（GAN）的因子挖掘模型，旨在解决传统IC损失函数与深度Transformer网络在金融因子挖掘中的两个关键问题： 1. **传统IC损失仅关注排序方向，未对分布形态进行结构性约束**，可能导致因子尾部区分度不足和跨期不稳定； 2. **深度Transformer网络在时序编码中缺乏底层表征约束**，可能将所有信号压缩至序列末端，造成潜空间漂移与过拟合。 为此，作者从最优传输理论与生成对抗学习两个方向出发，提出一系列优化模型，包括**全局分布对齐模型（GDA）**、**非平衡最优传输模型（UOA）**、**双轨Sinkhorn网络（DTSN）**与**双轨对抗挖掘网络（DTAN）**，并进行了因子分布检验与指数增强测试。 ## 主要观点 ### 1. 最优传输（OT）与金融的联系 - 最优传输理论提供了一种在概率测度空间上进行几何运算的严格语言，适用于金融数据分布对齐与建模； - Wasserstein距离相较于KL散度与JS散度具有更强的几何敏感性，尤其在支撑集不重叠时仍能提供连续的梯度信号； - 切片Wasserstein距离（SWD）通过投影减少计算复杂度，避免高维OT的瓶颈问题，且在分布差异检测中保留几何意义。 ### 2. 不平衡最优传输（UOT）的改进 - UOT通过软化边际约束，使模型在处理离群点、分布规模差异与分布偏移时更具鲁棒性； - KL-UOT在理论与实践中具有良好的性质，如存在唯一最优解、允许质量缩减、具有指数结构； - UOT的优化域扩大，支持部分匹配与非对称分布，提升了模型对复杂金融数据的适应能力。 ### 3. 生成对抗网络（GAN）的优化 - WGAN通过将JS散度替换为Wasserstein距离，解决了原始GAN的梯度消失问题； - WGAN-GP通过梯度惩罚项替代权重裁剪，提升了训练稳定性； - 在对抗框架中，Critic网络估计Wasserstein距离，生成器网络通过梯度下降优化以逼近真实分布； - 对抗网络的训练流程包括内外层循环，确保模型在动态博弈中收敛至纳什均衡。 ### 4. 双轨模型的创新点 - **双轨Sinkhorn网络（DTSN）**：在输出轨外新增潜空间锚定轨，通过动态更新的潜特征记忆库将截面表征锚定于跨时间牛股参照系，增强模型的稳定性； - **双轨对抗挖掘网络（DTAN）**：用两个WGAN-GP判别器替代固定距离度量，使分布度量在对抗博弈中自适应进化，提升模型对分布形状的拟合能力。 ## 关键信息 ### 1. 模型表现对比 | 模型 | 因子IC均值 | 多头组合年化收益率 | 相较于基线模型提升 | |------|-------------|---------------------|---------------------| | GDA | 0.1045 | 38.66% | +3pp | | UOA | 0.1117 | 40.50% | +2pp | | DTSN | 0.1137 | 42.19% | +2pp | | DTAN | 0.1173 | 45.04% | +3pp | ### 2. 因子分布形状检验 - GDA在W1分布形状拟合指标上表现最佳（W1=0.090）； - DTAN在W1指标上优于其他模型（W1=0.180），说明其在保留分布形状信息方面更具优势； - UOA与DTSN的W1值分别为0.110与0.113，表现次之。 ### 3. 指数增强测试结果 | 指数 | DTAN年化超额收益率 | |------|---------------------| | 沪深300 | 13.36% | | 中证1000 | 24.22% | | 国证2000 | 31.75% | ### 4. 风险提示 - 所有结论基于历史数据，存在数据滞后性与第三方数据不准确的风险； - 策略效果仅对回测区间有效，不保证未来表现，不构成投资建议。 ## 模型结构与训练流程 - **基线模型**：基于Transformer与IC损失，采用20个时序特征，如开盘价、收盘价、动量、规模、流动性等； - **GDA模型**：引入切片Wasserstein距离，进行全局分布对齐； - **UOA模型**：采用KL松弛边缘约束与topk目标边缘增强，实现多头倾斜与条件感知； - **DTSN模型**：在输出轨外新增潜空间锚定轨，通过潜特征记忆库增强跨期稳定性； - **DTAN模型**：用WGAN-GP判别器替代固定距离度量，实现对抗学习下的分布自适应匹配。 ## 相关研究与背景 - 本文与以下研究有密切联系，如T2RL、OpenClaw、BLACK-LITTERMAN模型、多周期嵌套策略等； - 提出的模型与方法是对现有因子挖掘框架的优化，具有较强的理论与实践基础。 ## 总结 本文通过引入最优传输理论与对抗生成学习，构建了多个因子挖掘模型，显著提升了因子的排序能力与分布匹配效果。DTAN模型在各项指标上表现最优，具有较强的分布拟合能力与回撤控制效果，适合应用于金融市场的时序特征建模与因子挖掘任务。模型在沪深300、中证1000与国证2000指数增强策略中均表现出优于基线模型的超额收益能力，具有较强的实证价值。