> **来源:[研报客](https://pc.yanbaoke.cn)** # RD-Agent 框架总结 ## 核心内容 RD-Agent 是微软亚洲研究院开源的“AI 驱动研发自动化”框架,旨在通过大语言模型(LLM)自主完成因子研究闭环,提升量化研究效率。其核心理念是将因子研究分解为“假设生成→任务分解→代码实现→执行回测→反馈生成”的五步循环,实现因子的自动化挖掘与迭代优化。 该框架以 Qlib 作为量化基础设施底座,负责数据处理、模型训练与绩效计算。框架主要运行于 Linux 环境,Windows 用户需通过 WSL2 部署。 ## 主要观点 1. **因子挖掘流程**: - **假设生成**:LLM 通过双层 Trace 注入,从历史实验记录中提出新因子方向,避免重复且提供即时纠错。 - **任务分解**:将假设转化为结构化的因子任务清单,明确因子名称、类型、公式及变量解释。 - **代码实现**:使用 CoSTEER 代码生成引擎,最多进行 10 轮“写代码—测试—修正”自动调试,结合成功与失败案例库进行 RAG 检索,提高首次生成成功率。 - **执行回测**:在隔离的 Conda 环境中逐因子运行,与 Alpha158 特征合并送入 LightGBM,计算 IC、ICIR 等绩效指标。 - **反馈生成**:LLM 根据回测结果判断是否更新 SOTA 库,并给出下一轮探索方向。 2. **LightGBM 与 Alpha158**: - LightGBM 是默认模型,具备 GOSS 和 EFB 两项算法创新,提升训练速度与精度。 - Alpha158 是 Qlib 内置的 158 个量价因子集合,作为因子检验的基准,提高因子有效性的判断门槛。 3. **实测结果**: - 完成 36 个有效 Loop,组合双周频 IC 提升至 0.07。 - GLM-V5.1 在因子挖掘任务上全面优于 DeepSeek-V3.2,后者频繁出现无限重复输出与编码失败。 - 最终 SOTA 因子库以交叉/交互、盈利质量、分析师预期、现金流为主要贡献因子。 ## 关键信息 - **LLM 选择**:GLM-V5.1 显示出更高的代码鲁棒性,而 DeepSeek-V3.2 存在输出重复与编码失败的问题。 - **因子类型**:最终 SOTA 因子库涵盖动量/反转、价值、盈利成长、现金流质量、量价技术、分析师预期、行业市值中性、机器学习共八大类。 - **数据与回测设置**:使用 Wind A 股数据,包含约 5792 只股票、165 个字段,财务数据按公告日 PIT 对齐。 - **性能指标**:组合平均 IC 从 0.0621 提升至 0.0699,但 ICIR 提升幅度始终弱于 IC,主要由于测试期与训练期市场环境差异及部分因子的过拟合问题。 ## 优劣势总结 ### 优势 1. **因子研究效率显著提升**:预计每月可产出约 900 个因子,远高于人工产出。 2. **自动发现人类盲区**:LLM 不受经验限制,可提出研究员难以想到的非常规因子组合。 3. **累积式学习机制**:SOTA 库保证好因子不丢失,每轮在最优基础上继续探索。 4. **完整的实验溯源**:每轮实验的假设、代码、回测结果均可复现,便于审计与归因。 5. **多数据源整合能力**:一旦数据管线搭建完成,LLM 可高效调用大规模字段集。 ### 劣势 1. **运行稳定性差**:在 WSL 环境下出现多次崩溃,需手动重启。 2. **LLM 代码质量不稳定**:即使是 GLM-V5.1 也会在复杂操作中出错,如臆造字段或忽视前视偏差。 3. **IC 与实际收益脱钩**:框架以 IC 为优化目标,未充分考虑 ICIR、换手率等实盘关键指标。 4. **对 A 股特殊机制理解不足**:对涨跌停、停牌、ST 等机制的把握有限,可能影响因子的有效性。 ## 推荐场景与优化方向 ### 推荐场景 1. **新数据源快速探索**:用于新数据集的因子潜力挖掘,效率远高于人工逐一构思。 2. **现有因子库的增量补充**:用于发现传统研究员易忽视的非常规组合,而非替代现有流程。 ### 优化方向 1. **Prompt 注入领域知识**:提升 LLM 假设生成的深度与有效性。 2. **多目标优化**:将 IC、ICIR、换手率、回撤等指标纳入反馈评估,提升因子可实施性。 3. **引入另类数据**:如新闻情绪、供应链网络等,拓展因子边界。 4. **迭代更强的代码模型**:随着大模型能力的提升,提高代码生成质量与效率。 5. **改进内存管理与计算效率**:优化框架稳定性,增加非 SOTA 因子的及时清理机制。 ## 风险提示 1. **历史数据依赖**:量化结论基于历史统计,未来市场环境变化可能导致因子失效。 2. **LLM 代码错误**:存在生成错误代码的风险,需人工抽检与防御式校验。 3. **因子随机性**:LLM 挖掘因子具有一定随机性,报告中因子不保证可重复挖掘。 4. **过拟合风险**:激进参数下因子可能过拟合,影响实盘表现。 ## 结论 RD-Agent 是一个具有升级潜力的辅助因子研究工具,其在因子挖掘效率、自动发现盲区、累积学习、实验溯源与多数据源整合方面表现出色,但运行稳定性、代码质量、IC 与实盘收益脱钩以及对 A 股机制理解不足仍是其当前的限制。建议优先用于新数据源探索与现有因子库的补充,并通过优化 Prompt、多目标评估、引入另类数据及迭代代码模型持续改进。