> **来源:[研报客](https://pc.yanbaoke.cn)** # 财报附注结构拆解、数据提取与财务画像总结 ## 核心内容 本报告系统分析了财报附注的结构,并提出了从附注中提取23个核心科目、79个细分数据列的自动化方法,用于构建财务画像和基本面因子,以提供传统财务报表之外的增量信息,支持量化投资模型的构建与优化。 ## 主要观点 - **财报附注的价值**:相比传统合并报表的总量数据,财报附注能够提供更丰富的微观信息,有助于穿透企业真实业务运转与隐性风险,为量化模型提供超额Alpha信号。 - **自动化数据提取**:通过代码系统实现财报附注数据的自动化提取,包括语义感知坐标定位、结构清洗修复、文本信息提取等技术手段,解决附注非标准化带来的解析难题。 - **LLM模型应用**:引入LLM模型(如gemma3:4b)对管理层讨论与分析进行语义归纳,实现非结构化文本向结构化信息的转化,提高分析效率与信息完整性。 - **财务综合画像Skill**:开发了“FN Portrait Toolkit”工具,支持财报自动下载、解析与可视化画像生成,可在ClawHub平台安装使用。 - **基本面因子构建**:基于附注数据构建了基本面因子,已在科创板测试,显示因子完整度高、相关性低,具备提供增量信息的能力。 ## 关键信息 ### 1. 资产负债表项目注释 - **应收账款**:分为按账龄和按坏账计提方法分类披露,详细列示了期末余额、期初余额、坏账准备金额及计提比例。 - 2025年6月30日:期末应收账款账面余额为28,137,160,035.36元,坏账准备为1,971,754,826.14元。 - 2024年12月31日:期末应收账款账面余额为28,900,570,772.57元,坏账准备为1,927,205,655.94元。 - **按欠款方归集的前五名应收账款**: - 2025年6月30日:合计2,399,658,195.87元,占比3.92%。 - 2024年12月31日:合计3,033,480,470.74元,占比4.93%。 - **存货**:分为原材料、在产品、库存商品等,列示账面余额、跌价准备及账面价值。 - 2025年1-6月:期末存货账面价值为3,830,598,529.95元,跌价准备为6,094,196.98元。 - 2024年:期末存货账面价值为3,453,911,412.70元,跌价准备为6,103,652.17元。 - **固定资产**:披露了原值、累计折旧、减值准备及账面价值,包括按项目分类的变动情况。 - 2025年6月30日:固定资产账面价值为4,839,693,950.72元,累计折旧为1,444,881,837.27元。 - 2024年12月31日:固定资产账面价值为4,957,256,807.77元,累计折旧为1,404,603,821.54元。 - **在建工程**:披露了预算数、期初余额、期末余额、工程累计投入比例等。 - 2025年6月30日:在建工程期末余额为853,007,987.37元,主要项目包括轨道交通列控系统基地数字化智能化改造等。 - **商誉**:列示了商誉账面原值、减值准备及减值测试方法。 - 2025年1-6月:商誉账面原值为305,324,128.58元,其中长沙设计院和郑州中安分别计提了25,768,400.00元和16,664,700.00元的减值准备。 ### 2. 负债与权益类项目注释 - **短期借款与长期借款**:披露了借款类型(如质押、信用)、金额及期限结构。 - 2025年6月30日:短期借款期末余额为86,984,964.66元,其中质押借款为52,008,457.68元。 - 2024年12月31日:长期借款期末余额为6,048,917,940.69元,其中质押借款为2,987,013,923.00元。 - **应付职工薪酬**:列示了短期薪酬与离职后福利的计提与发放情况。 - **未分配利润**:披露了净利润提取盈余公积、风险准备及派发现金股利的具体情况。 ### 3. 利润表项目注释 - **营业收入与营业成本**:按产品类别、业务类型及经营地区进行多层次拆分。 - 2025年6月30日:主营业务收入为14,543,977,461.44元,成本为10,371,126,634.45元。 - 2024年12月31日:主营业务收入为14,097,839,248.46元,成本为9,958,431,345.53元。 - **按经营地区分类**: - 中国:主营业务收入为12,240,483,301.73元,成本为1,356,100,485.62元。 - 其他国家和地区:主营业务收入为944,473,022.20元,成本为-元。 ## 风险提示 - 报告结论基于历史价格信息和统计规律,不能准确预测市场走势。 - 历史收益不代表未来业绩表现,文中观点仅供参考,不构成投资建议。 ## 技术实现 - **数据来源**:财报PDF全部来自巨潮资讯。 - **下载方式**:采用高频时间切片轮询策略多进程并发下载,提高获取效率。 - **数据提取**:通过语义定位、结构清洗、文本提取等技术实现高效、精准的数据提取。 - **LLM模型应用**:gemma3:4b模型在信息完整度与运行效率间取得最优平衡,被选为默认分析模型。 ## 应用示例 - **财务综合画像生成**:通过FN Portrait Toolkit工具,可生成企业的财务画像,用于投研分析。 - **基本面因子构建**:基于附注数据构建的因子在科创板测试中表现良好,为基本面量化模型提供支持。 ## 相关研究 - 【银河金工】2026年年度策略报告 - 【银河金工】主题选股策略系列(成长与消费方向) - 【银河金工】主题选股策略系列(成长盈利现金流三足鼎立) ## 总结 本报告通过对财报附注的结构拆解与数据提取,揭示了企业微观财务信息的丰富性与重要性,并展示了如何通过自动化与LLM技术实现高效信息处理。财报附注数据的提取与分析为量化投资提供了增量信息,有助于构建更全面的财务画像与基本面因子。同时,报告也提醒了投资者在使用这些信息时需注意其局限性与风险。