> **来源:[研报客](https://pc.yanbaoke.cn)** # 机器学习因子选股月报(2026年4月)总结 ## 核心内容概述 本报告基于西南证券研究院发布的《量价时序特征挖掘模型在深度学习因子中的应用》(2024年7月11日)中提到的GAN_GRU模型,定期更新该因子自2024年以来的表现情况。GAN_GRU因子结合了生成式对抗网络(GAN)与门控循环单元(GRU)模型,用于处理和编码量价时序特征,从而生成选股因子。 ## 主要观点 - **因子表现**:自2019年2月至2026年3月,月频调仓下,GAN_GRU因子在全A范围内IC均值为 $0.1096^{***}$,多头组合年化超额收益率为 $21.87\%$。截至2026年3月27日,最新一期IC为 $0.1008^{***}$,近一年IC均值为 $0.0514^{***}$。 - **行业表现**: - 近期(2026年2月)IC排名前五的行业(除综合)为:传媒($0.4279^{***}$)、煤炭($0.2355^{***}$)、商贸零售($0.2003^{***}$)、食品饮料($0.1701^{***}$)、基础化工($0.1395^{***}$)。 - 近一年IC均值排名前五的行业(除综合)为:传媒($0.1304^{***}$)、钢铁($0.1212^{***}$)、商贸零售($0.1191^{***}$)、计算机($0.1064^{***}$)、食品饮料($0.0988^{***}$)。 - **多头组合表现**: - 2026年2月当期,多头组合超额收益最高的五个行业(除综合)为:传媒($4.57\%$)、农林牧渔($3.26\%$)、建材($3.19\%$)、轻工制造($2.53\%$)、煤炭($2.22\%$)。 - 近一年,多头组合月平均超额收益最高的五个行业(除综合)为:房地产($1.83\%$)、商贸零售($1.41\%$)、消费者服务($1.39\%$)、汽车($1.18\%$)、电力及公用事业($1.07\%$)。 - 近一年,有8个中信一级行业(除综合)未跑赢行业指数,包括:交通运输、建材、煤炭、非银金融、传媒、有色、通信、煤炭。 - **因子构建与模型说明**: - GAN_GRU模型由GAN模型生成量价时序特征,再通过GRU模型进行时序编码,最终输出选股因子。 - 模型使用18个量价特征(如收盘价、成交量、换手率等),以月频调仓方式进行预测与回测。 - 模型训练方式为半年滚动训练,训练集与验证集比例为 $80\%:20\%$,并采用时序去极值+标准化与个股截面标准化处理。 - GAN生成器采用LSTM结构,判别器采用CNN结构,以保留量价时序的二维“图片”特性。 ## 关键信息 ### 模型结构 - **生成器(G)**:采用LSTM结构,输入为 $40 \times 18$ 的量价时序特征,输出为处理后的特征。 - **判别器(D)**:采用CNN结构,用于识别生成器输出的特征是否与真实数据相符。 - **GRU模型**:用于对生成的特征进行时序编码,最终输出预测收益 $pRet$ 作为选股因子。 ### 回测结果 - **IC值**:全A范围内IC均值 $0.1096^{***}$,最新一期IC为 $0.1008^{***}$,近一年IC均值为 $0.0514^{***}$。 - **多头组合收益**: - 年化超额收益率为 $21.87\%$。 - 年化收益率为 $36.03\%$,年化波动率为 $21.87\%$,信息比率为 $1.55$,最大回撤率为 $27.29\%$。 ### 2026年4月因子排名前十股票 | 排名 | 代码 | 简称 | 中信一级行业 | |------|----------|------------|----------------| | 1 | 605179.SH | 一鸣食品 | 食品饮料 | | 2 | 300768.SZ | 迪普科技 | 计算机 | | 3 | 603160.SH | 汇顶科技 | 电子 | | 4 | 600415.SH | 小商品城 | 商贸零售 | | 5 | 002516.SZ | 旷达科技 | 汽车 | | 6 | 688169.SH | 石头科技 | 机械 | | 7 | 301269.SZ | 华大九天 | 计算机 | | 8 | 002239.SZ | 奥特佳 | 汽车 | | 9 | 920982.BJ | 锦波生物 | 医药 | | 10 | 603605.SH | 珀莱雅 | 基础化工 | ### 风险提示 - 本报告基于公开历史数据,未来市场环境变化可能导致因子表现与历史不同。 - 存在第三方数据不准确的风险。 - 个股预测结果不构成投资建议或收益保证,投资者需自行评估风险偏好与承受能力。 - 投资有风险,入市需谨慎。 ## 结论 GAN_GRU因子通过结合GAN和GRU模型,有效捕捉量价时序特征,展现出一定的选股能力。在不同行业中的表现存在差异,传媒、煤炭、商贸零售等行业表现较为突出。然而,模型的实际表现可能受市场环境变化影响,投资者需谨慎对待因子结果并结合自身情况做出决策。