> **来源:[研报客](https://pc.yanbaoke.cn)** # Kronos:基于 K 线预训练的金融基础模型 ## 核心内容 Kronos 是由清华大学交叉信息研究院与自动化系联合提出的金融基础模型,发表于 AAAI 2026 会议,旨在通过统一的建模框架实现价格预测、收益预测、波动率预测、K 线生成与投资模拟等多任务处理。该模型的核心思想是“先理解市场走势,再统一服务预测与选股任务”,通过 K 线离散化与自回归生成机制,构建统一的市场状态序列,从而提升模型的泛化能力和预测稳定性。 ## 主要观点 - **统一预训练框架**:Kronos 不再局限于单任务建模,而是通过统一表示学习,在大规模金融数据上构建一个通用的市场演化模型。 - **层次化离散表示**:将连续 K 线转化为粗粒度与细粒度 token,使模型能够捕捉市场趋势、波动和局部扰动等结构信息。 - **生成驱动预训练**:通过自回归机制,模型学习市场状态如何随时间演化,从而具备生成未来价格路径的能力。 - **多任务统一建模**:同一模型可用于价格预测、收益预测、波动率预测、K 线生成与投资模拟,提升数据利用效率。 - **推理增强**:通过多次生成未来路径,降低单次预测误差,提升预测结果的稳定性与排序信号的可靠性。 ## 关键信息 ### 1. 数据离散化 - 将连续 K 线数据转换为结构化的“市场状态序列”。 - **粗粒度层**:捕捉中长期趋势与波动。 - **细粒度层**:捕捉短期波动与局部扰动。 - 通过层次化离散机制,使模型更稳定地刻画市场结构。 ### 2. 自回归预训练 - 模型通过预测未来 token 的分布,学习市场演化规律。 - 预训练目标为学习“市场如何演化”,而非直接预测具体价格或收益。 - 在跨市场、多资产数据上进行训练,提升模型的泛化能力。 ### 3. 多任务统一建模 - 同一模型可输出价格、收益、波动率等多类预测结果。 - 在收益预测任务中,模型可生成逐股票未来收益率预测,并在截面上进行排序,形成选股信号。 - 生成的 K 线路径可用于情景模拟、数据增强与策略回测。 ### 4. 推理阶段增强 - 通过多次生成未来路径,提升预测结果的稳定性。 - 对生成的路径进行聚合,形成更准确的预测信号与排序结果。 - 实验表明,随着推理采样次数的增加,模型在价格预测与收益预测任务中的表现持续提升。 ## 亮点分析 | 亮点 | 说明 | |------|------| | **建模对象** | 从“价格序列”转向“金融市场语言”,通过 K 线离散化提升建模抽象层级。 | | **预训练机制** | 从“任务驱动”转向“生成驱动”,模型自动学习市场演化规律。 | | **应用边界** | 不仅服务于选股,还覆盖价格预测、波动率预测、K 线生成与投资模拟等任务。 | | **信息处理方式** | 与 DFQ-Diversify 互补,Kronos 提供统一表示,DFQ-Diversify 提升模型在分布变化下的稳健性。 | | **体系价值** | 推动金融时序建模从“定制化任务驱动”走向“统一基础模型驱动”,为量化研究提供更通用的信号生成底座。 | ## 实证结果 Kronos 在多个任务中均表现优于主流基准模型,具体包括: | 任务 | 性能提升 | |------|----------| | **价格预测** | RankIC 相较最强 TSFM 基线提升约 $93\%$ | | **波动率预测** | MAE 相较基准模型下降约 $9\%$ | | **K 线生成** | 生成质量提升约 $22\%$ | | **收益预测** | 在截面上计算 IC 与 RankIC,用于选股排序 | | **投资模拟** | 在 A 股市场中构建 long-only 组合,年化超额收益与信息比率均优于基准方法 | 此外,Kronos 在不同规模模型(small、base、large)中表现稳定,且随着词表规模与推理路径数量的增加,模型预测能力持续增强。 ## 优化方向 为适配 A 股市场特征,Kronos 的优化方向包括: 1. **数据层**:补充换手率、振幅、波动率等 A 股相关衍生特征,增强对本土市场结构的刻画。 2. **下游映射**:将模型输出转化为截面因子,用于选股与组合构建。 3. **稳健性增强**:结合 DFQ-Diversify 的领域解耦框架,提升模型在风格切换与市场变化下的泛化能力。 4. **生成能力应用**:将生成能力用于数据增强、情景模拟与策略压力测试。 5. **工程路径**:优先复用离散化表示与自回归建模模块,逐步嵌入现有量化研究体系,实现模块化落地。 ## 风险提示 - 量化模型基于历史数据,未来存在失效风险,需持续跟踪模型表现。 - 极端市场环境可能对模型效果造成冲击,导致收益亏损。 ## 附录:相关报告 | 报告标题 | 发布日期 | |----------|----------| | 金融风洞:用相似历史行情合成个股收益序列 | 2026-05-12 | | 高维环境下的最优因子择时 | 2026-04-21 | | SSPT:股票时序定制化预训练选股框架 | 2026-04-13 | | QuantaAlpha:用大模型做量化因子挖掘 | 2026-04-07 | ## 图表目录 1. **图 1**:Kronos 多任务性能对比,显示其在预测与生成任务中的优势。 2. **图 2**:Kronos 整体框架,展示从 K 线离散化到自回归预训练的流程。 3. **图 3**:K 线 Tokenizer 结构,展示层次化离散化机制。 4. **图 4**:Kronos 模型结构配置,对比不同规模模型的参数与结构。 5. **图 5**:Kronos 主实验结果,显示其在多个任务中的优势。 6. **图 6**:生成分布对比,Kronos 生成的 K 线更接近真实市场数据。 7. **图 7**:Kronos 消融实验,验证离散化与自回归建模对预测性能的提升。 8. **图 8**:词表规模影响,显示更细粒度表示对模型性能的提升。 9. **图 9**:推理增强效果,显示多路径采样对预测能力的提升。