> **来源:[研报客](https://pc.yanbaoke.cn)** # 【广发金工】日内高频知情交易因子总结 ## 核心内容 本文是广发证券金工团队“海量Level 2数据因子挖掘”系列的第七篇,重点在于构建和分析日内高频知情交易因子。通过利用Level 2逐笔订单数据,团队提出了基于VPIN模型和DPIN模型的因子,以识别市场中知情交易者的交易行为,并评估其对投资收益的影响。 ## 主要观点 1. **市场信息不完全**:有效市场假说认为资产价格反映所有公开信息,但实际市场存在信息不对称和交易摩擦,知情交易者利用私人信息获取超额收益。 2. **因子构建方法**: - **VPIN类因子**:通过衡量主买与主卖在成交量、成交额、成交笔数上的不平衡,构建了VPIN_vol、VPIN_amt、VPIN_cnt三个因子。 - **DPIN类因子**:基于“3种行为特征”ד4种时间特征”ד3种统计特征”,构建了36个DPIN因子,进一步细化知情交易行为的分析。 3. **因子表现**: - VPIN类因子在20190301~20260430期间,VPIN_vol因子的月度换仓年化收益率为16.53%,相比中证全指的超额年化收益率为8.72%。 - DPIN类因子中,DPIN_base_total_std等因子月度RankIC大于8%,方向胜率接近70%,显示较强的独立性和有效性。 4. **因子相关性**:选取的9个表现较好的因子与Barra风格因子、深度学习因子及系列前序因子的相关系数均控制在0.5以内,表明因子具有较强的独立性。 5. **风险提示**: - 所述模型基于历史数据统计,可能因市场环境变化失效。 - 交易行为和市场结构的变化可能导致因子失效。 - 不同量化模型可能得出不同结论。 ## 关键信息 ### Level 1与Level 2数据对比 - **Level 1数据**:包含3秒一笔快照数据,如最高价、最低价、成交量、成交额等。 - **Level 2数据**:提供更丰富的快照数据(如10档申买申卖价、最优买卖价前50笔委托),并包含逐笔订单数据,时间精确到毫秒,包含订单类别、数量、金额等详细信息。 ### 系列研究报告回顾 - 系列报告通过Level 2数据挖掘出数百个因子,部分已用于构建具有超额收益的投资组合。 - 不同因子类型(如大小单、长短单、集合竞价、市价订单、重点时段)在不同时间周期下的RankIC表现和胜率均良好。 ### 因子表现分析(20190301~20260430) - **VPIN因子**: - VPIN_vol因子在5日换仓时IC均值为7.41%,胜率为70.4%。 - 在20日换仓时,其年化收益率为10.05%,方向胜率为73.6%。 - **DPIN因子**: - 36个DPIN因子中,DPIN_base_total_std等因子在20日换仓时表现优异。 - DPIN_base_total_std因子在5日换仓时IC均值为6.29%,胜率为64.0%;在20日换仓时,年化收益率为8.54%,方向胜率为68.5%。 - DPIN_big_am_std因子在20日换仓时年化收益率为14.43%,最大回撤率27.63%,夏普比率为0.17。 ## 结构与因子维度 ### 行为特征(3类) 1. **DPIN_base**:不限制成交量,根据收益率方向取主买或主卖笔数占比。 2. **DPIN_big**:仅当5分钟区间成交量大于全天中位数时计算DPIN_base,否则取0。 3. **DPIN_small**:仅当5分钟区间成交量小于等于全天中位数时计算DPIN_base,否则取0。 ### 时间特征(4类) 1. **total**:涵盖全天(09:30 至 14:57)。 2. **am**:早盘时段(09:30 至 10:00)。 3. **middle**:盘中时段(10:00 至 14:30)。 4. **pm**:尾盘时段(14:30 至 14:57)。 ### 统计特征(3类) 1. **均值(mean)**:衡量知情交易概率的平均水平。 2. **标准差(std)**:衡量知情交易概率的波动程度。 3. **稳定性(stable)**:均值与标准差的比值,衡量知情交易行为的稳定性。 ## 总结 本文构建的VPIN和DPIN因子在全市场范围内表现优异,具有较强的独立性和有效性。这些因子通过Level 2数据挖掘,能够识别知情交易行为,并在不同时间窗口下提供稳定的超额收益。然而,需注意模型在市场环境变化时可能失效,因此在实际应用中需持续监测和调整。