> **来源:[研报客](https://pc.yanbaoke.cn)** # 机器学习因子选股月报(2026年5月)总结 ## 核心内容概述 本报告基于西南证券研究院发布的《量价时序特征挖掘模型在深度学习因子中的应用》(2024年7月11日)中提到的GAN_GRU模型,定期更新其自2024年以来的表现情况。GAN_GRU因子通过生成式对抗网络(GAN)对量价时序特征进行处理,再通过门控循环单元(GRU)进行时序特征编码,形成一个具有较强预测能力的选股因子。 ## 主要观点 - **因子表现**:自2019年2月至2026年4月,GAN_GRU因子在全A范围内IC均值为 $0.1078^{***}$,多头组合年化超额收益率为 $21.62\%$。 - **最新一期表现**:截至2026年4月28日,最新一期IC为 $-0.0531^{***}$,近一年IC均值为 $0.0480^{***}$。 - **行业表现**: - **近期表现**:4月当期IC排名前五的行业为农林牧渔($0.3139^{***}$)、石油石化($0.2845^{***}$)、煤炭($0.2646^{***}$)、消费者服务($0.2021^{***}$)、银行($0.1941^{***}$)。 - **近一年表现**:IC均值排名前五的行业为传媒($0.1428^{***}$)、食品饮料($0.1319^{***}$)、商贸零售($0.1071^{***}$)、钢铁($0.1066^{***}$)、纺织服饰($0.1065^{***}$)。 - **多头组合表现**: - **4月当期**:超额收益最高的五个行业为石油石化($8.84\%$)、消费者服务($7.72\%$)、农林牧渔($4.33\%$)、建筑($4.18\%$)、纺织服饰($3.86\%$)。 - **近一年**:月平均超额收益最高的五个行业为消费者服务($2.08\%$)、电力及公用事业($1.64\%$)、房地产($1.59\%$)、商贸零售($1.47\%$)、建筑($1.21\%$)。 - **未跑赢行业指数**:近一年有6个行业未跑赢对应行业指数,包括煤炭、建材、电子、有色金属、通信。 ## 关键信息 ### 模型结构与参数设置 - **模型组成**:GAN_GRU因子由GAN模型生成量价时序特征,再通过GRU模型进行编码。 - **特征处理**: - **量价特征**:包括收盘价、开盘价、成交量、换手率等共18个特征。 - **特征频率**:日频特征与月频特征相结合。 - **训练与预测**: - **训练数据**:过去400天内的18个量价特征,每5个交易日采样一次。 - **训练方式**:半年滚动训练,每年6月30日和12月31日进行模型训练。 - **数据处理**:对每个特征进行时序去极值、标准化及个股层面上截面标准化。 - **模型结构**:GRU(128, 128) + MLP(256, 64, 64)。 - **超参数设置**:batch_size为截面股票数量、优化器为Adam、学习速率为1e-4、损失函数为IC、早停轮数为10、最大训练轮数为50。 ### 最新股票推荐 截至2026年4月28日,根据GAN_GRU因子得分排名前10的股票为: 1. 通用股份(601500.SH) - 汽车 2. 广电运通(002152.SZ) - 计算机 3. 传化智联(002010.SZ) - 交通运输 4. 山东药玻(600529.SH) - 医药生物 5. 盾安环境(002011.SZ) - 家用电器 6. 万润股份(002643.SZ) - 电子 7. 福瑞达(600223.SH) - 美容护理 8. 芯联集成-U(688469.SH) - 电子 9. 陆家嘴(600663.SH) - 房地产 10. 楚江新材(002171.SZ) - 有色金属 ### 风险提示 - 本报告结论基于公开历史数据,未来市场环境变化可能导致因子表现与报告结论存在差异。 - 存在第三方数据不准确的风险。 - 文中个股预测结果不构成投资建议或收益保证。 - 投资者应充分认知自身风险偏好及承受能力,市场有风险,投资需谨慎。 ## 结论 GAN_GRU因子在全A范围内表现稳健,具有较高的信息系数(IC)和超额收益能力。其在多个行业中表现出良好的选股效果,尤其在近期和近一年的表现中,部分行业如石油石化、消费者服务、农林牧渔等表现突出。尽管因子在部分行业中未跑赢行业指数,但整体上仍具有一定的投资价值。投资者在使用该因子进行选股时,应结合自身风险偏好和市场情况,审慎决策。