> **来源:[研报客](https://pc.yanbaoke.cn)** # 中金 | Token启示录(二):单位经济模型探讨 总结 ## 核心内容 本报告聚焦于大模型厂商在Agentic AI加速渗透背景下,Token Factory商业模式的单位经济模型分析,包括Token的单位成本测算、单位价格测算以及整体经济模型的毛利率分析。报告旨在为市场提供对Token经济模型的深入理解,并探讨其在中长期的商业化前景。 ## 主要观点 ### 1. Token单位成本测算 - **算力自建**:假设使用NVL72机柜(72颗GB200)作为推理算力基座,推理成本估计在**2美元/百万Tokens**左右。 - **算力租赁**:基于Coreweave等主流平台价格,假设租赁价格为10美元/GPU Hour,测算得每百万Tokens的推理成本约为**2.6美元**。 - **关键因素**:推理端的Tokens输出效率是决定综合成本的核心,GB200单卡推理效率可达1,000 Tokens/s,但具体效率受模型参数规模、算法优化及基础设施优化等因素影响。 ### 2. Token单位价格测算 - **定价结构**:输出Tokens的定价通常是输入Tokens的几倍,但Agent应用中输入Tokens占比显著提升,导致平均价格有所下降。 - **价格分层**:随着模型智能水平的提升,高智能模型仍会享有溢价,未来可能出现价格分层现象。 - **国产模型定价**:目前国产模型API定价普遍低于海外,但随着模型能力提升,未来有望提价至对标海外模型的**30%-50%**水平。 ### 3. Token经济模型分析 - **单机柜模型**:基于算力自建和租赁两种模式,测算出理论毛利率分别为**60%**和**20%**。 - **Token Factory模式**:已成全球大模型主流商业模式,海外头部厂商如Anthropic的ARR增长迅速,预计未来更多厂商将聚焦于Agent和Coding方向。 - **毛利率趋势**:海外头部大模型公司API业务毛利率在**40%-50%**区间,国内厂商则在**20%-40%**区间,但趋势向好。 - **盈利模型**:随着推理规模扩大和训练端成本摊薄,模型公司有望在中期达到整体净利润的盈亏平衡点,长期利润空间可观。 ## 关键信息 ### 成本端 - **自建算力成本**:NVL72单机柜年化总费用约为1.77百万美元,其中年折旧成本约1.01百万美元,电费约0.11百万美元,其他费用约0.65百万美元。 - **租赁算力成本**:NVL72单机柜年租金约2.4百万美元,结合租赁效率和使用比例,测算出每百万Tokens的总成本为2.6美元。 ### 价格端 - **输入与输出比例**:Agent应用中输入占比为8:1,而ChatBot为2:1。 - **价格差异**:海外头部模型如Claude-4.6 Opus、GPT-5.4的平均价格分别为6.36美元和3.44美元/百万Tokens,而国产模型如Qwen、GLM等价格相对较低,但有上升空间。 ### 商业模式与盈利前景 - **Token Factory模式**:作为“为过程付费”的商业模式,其毛利率具有正向趋势,未来有望跑通大模型的净利润和ROI。 - **未来方向**:随着模型能力提升和AI应用成熟,“为结果付费”的商业模式可能成为更理想的盈利模式,但目前仍处于早期探索阶段。 ## 风险提示 - **Agentic AI渗透率波动**:AI技术进步速度和渗透率非线性增长,可能影响商业化进程。 - **AI ROI不及预期**:若云厂商投入的Capex无法带来预期回报,可能影响市场情绪。 - **测算误差**:报告中涉及的多个测算假设可能带来误差,包括成本、价格和盈利预测。 ## 图表要点 - **图表1**:展示算力自建Capex角度的Token成本测算。 - **图表2**:展示算力租赁Opex角度的Token成本测算。 - **图表3**:海外头部大模型Token价格结构及平均价格测算。 - **图表4**:国内大模型Token价格结构及平均价格测算。 - **图表5**:Token Factory模式下的理论毛利率测算。 - **图表6**:大模型公司假设IS模型,展示中期和长期的盈利趋势。 - **图表7**:Token经济模型下可能的价值分配比例。 ## 结论 Token Factory模式在当前Agentic AI快速渗透的背景下,已成为大模型厂商主流的商业化路径。单位Token的成本与价格受算力效率、模型参数规模及市场结构影响,国产模型在定价和毛利率上仍有提升空间。随着技术迭代和市场成熟,Token经济模型有望推动大模型行业实现盈利,但短期内仍需关注渗透率波动和ROI预期等风险因素。