> **来源:[研报客](https://pc.yanbaoke.cn)** # 技术白皮书(型号9000) 文档版本 14 发布日期 2025-12-31 版权所有 © 华为技术有限公司 2025。保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。 # 商标声明 HUAWEI和其他华为商标均为华为技术有限公司的商标。 本文档提及的其他所有商标或注册商标,由各自的所有人拥有。 # 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或暗示的声明或保证。 由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。 # 华为技术有限公司 地址: 深圳市龙岗区坂田华为总部办公楼邮编:518129 网址: https://e.huawei.com # 安全声明 # 产品生命周期政策 华为公司对产品生命周期的规定以“产品生命周期终止政策”为准,该政策的详细内容请参见如下网址:https://support.huawei.com/ecolumnsweb/zh/warranty-policy # 漏洞处理流程 华为公司对产品漏洞管理的规定以“漏洞处理流程”为准,该流程的详细内容请参见如下网址:https://www.huawei.com/cn/psirt/vul-response-process 如企业客户须获取漏洞信息,请参见如下网址:https://securitybulletin.huawei.com/enterprise/cn/security-advisory # 华为初始证书权责说明 华为公司对随设备出厂的初始数字证书,发布了“华为设备初始数字证书权责说明”,该说明的详细内容请参见如下网址:https://support.huawei.com/enterprise/zh/bulletins-service/ENEWS2000015766 # 华为企业业务最终用户许可协议(EULA) 本最终用户许可协议是最终用户(个人、公司或其他任何实体)与华为公司就华为软件的使用所缔结的协议。 最终用户对华为软件的使用受本协议约束,该协议的详细内容请参见如下网址: https://e.huawei.com/cn/about/eula # 产品资料生命周期策略 华为公司针对随产品版本发布的售后客户资料(产品资料),发布了“产品资料生命周期策略”,该策略的详细内容请参见如下网址:https://support.huawei.com/enterprise/zh/bulletins-website/ENEWS2000017760 # 概述 本文详细介绍Atlas300T训练卡(型号9000),包括外观特点、性能参数和配置应用等,让用户对其有一个深入细致的了解。 # 读者对象 本文档主要适用于以下人员: 售前工程师 技术支持工程师 $\bullet$ 维护工程师 # 免责声明 本技术白皮书对于具体技术指标的表述,包括但不限于规格及性能,将根据具体的产品发布情况确定。本技术白皮书并不构成对于相关产品的技术指标的承诺或保证。华为可能不定期就相关信息进行更新,华为保留对于相关产品或解决方案信息的更新或更正的权利,请参考最新发布的相关说明或介绍。 # 符号约定 在本文中可能出现下列标志,它们所代表的含义如下。 <table><tr><td>符号</td><td>说明</td></tr><tr><td>危险</td><td>表示如不避免则将会导致死亡或严重伤害的具有高等级风险的危害。</td></tr><tr><td>警告</td><td>表示如不避免则可能导致死亡或严重伤害的具有中等级风险的危害。</td></tr><tr><td>注意</td><td>表示如不避免则可能导致轻微或中度伤害的具有低等级风险的危害。</td></tr><tr><td>须知</td><td>用于传递设备或环境安全警示信息。如不避免则可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果。 “须知”不涉及人身伤害。</td></tr><tr><td>说明</td><td>对正文中重点信息的补充说明。 “说明”不是安全警示信息,不涉及人身、设备及环境伤害信息。</td></tr></table> # 修改记录 <table><tr><td>文档版本</td><td>发布日期</td><td>修改说明</td></tr><tr><td>14</td><td>2025-12-31</td><td>第十四次正式发布。 3.1 基本规格、4 硬件兼容性修改兼容性查询链接。</td></tr><tr><td>13</td><td>2024-04-03</td><td>第十三次正式发布。 · 3.1 基本规格修改内存规格信息。 · 3.6.2 散热规格修改芯片描述。</td></tr><tr><td>12</td><td>2023-12-22</td><td>第十二次正式发布。 5.1 带内管理修改参考文档名称。</td></tr><tr><td>11</td><td>2023-09-25</td><td>第十一次正式发布。 3.1 基本规格修改兼容性查询助手链接。</td></tr><tr><td>10</td><td>2023-06-28</td><td>第十次正式发布。 4 硬件兼容性补充兼容性查询助手链接。</td></tr><tr><td>09</td><td>2023-01-09</td><td>第九次正式发布。 · 优化1.1 概述、2.1 性能特点。 · 3.1 基本规格增加AI处理器、网络、散热方式、虚拟化实例规格。 · 3.5 电源管理增加辅助电源连接器针脚定义。 · 新增4 硬件兼容性。</td></tr><tr><td>08</td><td>2022-07-15</td><td>第八次正式发布。 修改3.1 基本规格。</td></tr><tr><td>07</td><td>2022-02-22</td><td>第七次正式发布。 更新5.2 带外管理。</td></tr><tr><td>06</td><td>2021-12-24</td><td>第六次正式发布。 修改1.1 概述。</td></tr><tr><td>05</td><td>2021-04-19</td><td>第五次正式发布。 修改3.1基本规格。</td></tr><tr><td>04</td><td>2020-12-10</td><td>第四次正式发布。 修改1.1概述、1.2前面板和3.1基本规格。</td></tr><tr><td>03</td><td>2020-10-10</td><td>第三次正式发布。 修改3.1基本规格。</td></tr><tr><td>02</td><td>2020-09-23</td><td>第二次正式发布。 修改3.1基本规格。</td></tr><tr><td>01</td><td>2020-06-10</td><td>第一次正式发布。</td></tr></table> # 目录 # 前言.. 3 # 1产品简介 1.1 概述 1.2前面板 2 1.3系统框图 3 # 2产品特点 5 2.1性能特点 5 2.2可维护性特点 5 2.3典型使用场景 5 # 3产品规格 7 3.1基本规格 7 3.2 环境条件 8 3.3 时钟要求 9 3.4热插拔 9 3.5 电源管理 9 3.6散热规格 10 3.6.1散热要求 10 3.6.2散热规格 10 # 4 硬件兼容性 12 # 5 维护管理 13 5.1 带内管理 13 5.2 带外管理 13 # 6 通过认证. 14 # 7 维保 17 # A 缩略语 18 # 1 产品简介 1.1 概述 1.2前面板 1.3 系统框图 # 1.1 概述 华为Atlas300T训练卡(型号9000)配合服务器,为数据中心提供强劲算力的AI加速卡,单卡可提供最高220TFLOPSFP16算力,加快深度学习训练进程。 Atlas300T训练卡(型号9000)具有超强算力、高度集成、高速带宽等特点,满足互联网、运营商、金融等需要人工智能训练以及高性能计算领域的算力需求。 图1-1外观 # 1.2 前面板 Atlas 300T 训练卡 (型号 9000) 前面板如图1-2所示,指示灯说明见表1-1。 图1-2前面板 表 1-1 前面板指示灯说明 <table><tr><td>序号</td><td>标识</td><td>含义</td><td>颜色</td><td>状态说明</td></tr><tr><td>1</td><td>LINK/ACT指示灯</td><td rowspan="2">网口运行状态指示</td><td>绿色</td><td>·灭:端口link down。 ·亮:端口link up。 ·闪烁:端口link up,有数据传输。</td></tr><tr><td>2</td><td>SPEED指示灯</td><td>绿色</td><td>·灭:端口link down。 ·亮:端口link up high speed。</td></tr></table> # 说明 仅支持接口左边组1的灯。 其接口如图1-3所示,接口说明见表1-2。 图1-3接口 表 1-2 接口说明 <table><tr><td>名称</td><td>类型</td><td>数量</td><td>说明</td></tr><tr><td>QSFP-DD接口</td><td>QSFP-DD</td><td>1</td><td>每个训练标卡当前驱动仅支持 1*100G,预留2*100G能力。</td></tr></table> # 1.3 系统框图 Atlas 300T 训练卡 (型号 9000) 的系统框图如图1-4所示。 图1-4系统框图 - Ascend 910 AI处理器是Atlas 300T 训练卡 (型号 9000) 卡的核心,支持2 Rank DDRC接口,接口速率最大支持2400Mbps,支持64bit的DDR4,容量16GB。 - iBMC可通过MCU获取PCB、BOM版本号等信息,同时获取单板温度、功耗、电源电压等信息。 - Ascend 910 AI处理器的供电采用高能效比的多相电源和华为自研的PSIP。 # 2 产品特点 2.1 性能特点 2.2 可维护性特点 2.3典型使用场景 # 2.1 性能特点 - 高度集成 AI算力、通用算力、I/O能力三合一。 - 处理器集成30个华为达芬奇AI Core +16个TaiShan核 + 1 * 100GE RoCE v2网卡。 - 超强算力 - 内置30个达芬奇AI Core。 - 提供业界领先的220TFLOPS FP16算力。 高速带宽 - 支持PCIe 4.0和1*100G RoCE高速接口,出口总带宽56.5 Gb/s。 - 无需外置网卡,训练数据和梯度同步效率提升 $10\% \sim 70\%$ # 2.2 可维护性特点 - 支持带内的在线升级功能,方便客户进行日常维护。 - 支持带内及带外获取温度、电压、功耗等设备状态信息。 - 完备的命令行管理功能,用户可以通过各种命令进行日常的设备管理。 - 支持带内及带外资产管理功能,提供序列号等信息,方便资产管理。 # 2.3典型使用场景 Atlas 300T 训练卡 (型号 9000)典型应用场景为AI训练,人机交互操作,如图2-1所示。 图2-1典型单机用户 - 系统管理员:操作界面是iBMC系统,通过带外的方式实现设备管理,包含OS安装,固件升级,服务器系统信息查询,故障处理。 - 生产装备人员:通过装备系统与iBMC系统(带外)和OS系统(带内)交互完成。 - 算法工程师:通过Tensorflow等AI框架开发网络模型,调试训练代码,导入训练数据集,启动训练,观测训练过程(包含多次迭代的loss趋势),导出训练好的模型。 # 3 产品规格 3.1 基本规格 3.2 环境条件 3.3 时钟要求 3.4 热插拔 3.5 电源管理 3.6散热规格 # 3.1 基本规格 基本规格如表3-1所示。 表 3-1 基本规格 <table><tr><td>特征</td><td>规格</td></tr><tr><td>形态</td><td>双槽位全高全长(10.5英寸)</td></tr><tr><td>AI处理器</td><td>昇腾910 AI处理器 集成30个华为达芬奇Al Core + 16个TaiShan核</td></tr><tr><td>内存规格</td><td>·32GB片上内存 ·16GB DDR4 ·2400Mbps ·支持ECC</td></tr><tr><td>编解码能力</td><td>支持16 channel 4K(或64 channel 1080P) 60 FPS H.264/H.265JPEG解码能力 1080P 2048 FPS,或等价的解码能力,最高分辨率为8192*4320PNG解码能力 1080P 240 FPS,或等价的解码能力,最高分辨率为4096*2160JPEG编码能力 1080P 256 FPS,或等价的编码能力,最高分辨率为8192*4320</td></tr><tr><td>虚拟化实例规格</td><td>支持通过虚拟化的方式将1路昇腾AI处理器切分成若干路虚拟NPU,每路虚拟NPU可支持16/8/4/2个AI Core,其他硬件资源(如内存)等比例切分。</td></tr><tr><td>PCIe接口</td><td>PCIe x16 Gen4.0</td></tr><tr><td>PCI IDs</td><td>Vendor ID: 0x19E5Device ID: 0xD801Subsystem Vendor ID: 0x0200Subsystem Device ID: 0x0100</td></tr><tr><td>网络</td><td>1*100GE QSFP-DD接口,支持RoCE协议</td></tr><tr><td>功耗</td><td>最大300W</td></tr><tr><td>散热方式</td><td>被动风冷</td></tr><tr><td>尺寸(长x高x宽)</td><td>266.7mm x 111.15mm x 39.04mm</td></tr><tr><td>重量</td><td>1.2kg</td></tr><tr><td>操作系统</td><td>详细信息请参见华为计算部件兼容性查询。</td></tr></table> # 3.2 环境条件 硬件应用环境条件如表3-2所示。 表 3-2 应用环境条件 <table><tr><td>环境指标</td><td>规格</td></tr><tr><td>温度</td><td>• 工作温度: 5℃~45℃ (41°F~113°F) • 存储温度: -40°C~+70°C (-40°F~+158°F)</td></tr><tr><td>相对湿度</td><td>• 工作湿度: 8%RH~90%RH (非冷凝) • 存储湿度: 5%RH~95%RH (非冷凝)</td></tr><tr><td>海拔高度</td><td>工作海拔高度:≤3050m 说明 按照ASHRAE 2015标准: · 配置满足ASHRAE Class A1、A2时,海拔高度超过900m,工作温度按每升高300m降低1℃计算。 · 配置满足ASHRAE Class A3时,海拔高度超过900m,工作温度按每升高175m降低1℃计算。 · 配置满足ASHRAE Class A4时,海拔高度超过900m,工作温度按每升高125m降低1℃计算。</td></tr></table> # 3.3 时钟要求 Atlas 300T 训练卡 (型号 9000)遵从标准PCIe标卡协议(PCI Express® Card Electromechanical Specification Revision 4.0),整卡只需要提供标准PCIe 4.0的时钟,信号质量满足PCIe规范。 # 3.4热插拔 Atlas 300T 训练卡 (型号 9000) 不支持通知式热插拔和暴力热插拔。 # 3.5 电源管理 Atlas 300T 训练卡 (型号 9000)遵从标准PCIe标卡协议(PCI Express® Card Electromechanical Specification Revision 4.0),整卡最大功耗300W,要求对应槽位可提供5.5A@12V及0.5A@3.3V标准供电能力,辅助电源连接器提供18.75A@12V。 电源连接器针脚间间距为 $4.20 \mathrm{~mm}$ , 如图3-1所示。 图3-1 电源连接器接口 辅助电源连接器针脚定义如下: <table><tr><td>序号</td><td>信号定义</td><td>描述</td></tr><tr><td>1</td><td>GND</td><td>接地</td></tr><tr><td>2</td><td>GND</td><td rowspan="3"></td></tr><tr><td>3</td><td>GND</td></tr><tr><td>4</td><td>GND</td></tr><tr><td>5</td><td>12V</td><td rowspan="4">12V电源线</td></tr><tr><td>6</td><td>12V</td></tr><tr><td>7</td><td>12V</td></tr><tr><td>8</td><td>12V</td></tr></table> # 3.6散热规格 # 3.6.1 散热要求 Atlas 300T 训练卡 (型号 9000)用于带风扇的主动散热环境,支持双向进风出风,风量必须满足散热要求,如表3-3所示。 表 3-3 散热要求 <table><tr><td>卡入风口平均温度/℃</td><td>卡进风口需求最低风速/CFM</td><td>压降/Pa</td></tr><tr><td>25</td><td>15</td><td>68</td></tr><tr><td>30</td><td>16</td><td>178</td></tr><tr><td>35</td><td>19</td><td>225</td></tr><tr><td>40</td><td>23</td><td>279</td></tr><tr><td>45</td><td>29</td><td>341</td></tr></table> # 说明 - 散热器入口环境温度为进风口的平均温度。 - 需求的风量是建议值,不同系统提供给Atlas300T训练卡(型号9000)的风量和温度可能存在差异,需要根据实际系统进行实测确定。 - Atlas 300T 训练卡 (型号 9000) 上电状态,需要有风量进行散热,需求的最低风量为 5.0CFM。 # 3.6.2 散热规格 Atlas 300T 训练卡 (型号 9000) 支持的入口温度为 $5^{\circ} \mathrm{C} \sim 45^{\circ} \mathrm{C}$ , 卡内部有温度监控点,带内及带外均可对 Ascend 910、存储芯片进行实时监控, 以确保该卡在工作过程中,温度值低于规格值, 不能超过规格值, 如表 3-4 所示。 表 3-4 关键器件温度规格 <table><tr><td>规格</td><td>Ascend 910 AI Core温度 °C</td><td>存储芯片温度 ℃</td></tr><tr><td>下电温度</td><td>115</td><td>105</td></tr><tr><td>降频温度</td><td>105</td><td>95</td></tr><tr><td>长期工作温度</td><td>≤105</td><td>≤95</td></tr></table> # 4 # 硬件兼容性 - Atlas 300T 训练卡 (型号 9000) 支持的华为服务器型号: Atlas 800 推理服务器(型号:3000)、Atlas 800 推理服务器(型号:3010),具体请参见华为计算部件兼容性查询的“整机/主板兼容性”。 - Atlas 300T 训练卡 (型号 9000)支持的第三方服务器型号,详细信息可登录昇腾兼容性认证服务器目录,使用产品型号进行查询。 # 5 维护管理 Atlas 300T 训练卡 (型号 9000) 提供了功能丰富的维护管理功能,包括运行在 OS 中的带内管理命令集和通过 iBMC 提供的带外管理功能。 # 5.1 带内管理 # 5.2 带外管理 # 5.1 带内管理 带内管理的功能有: - 在线升级功能,升级Firmware,方便用户的设备维护。 设备管理功能,支持获取设备的温度、电压、功耗等状态信息。 - 完备的命令行管理功能,用户可以通过各种命令进行日常的设备管理。 - 资产管理功能,提供序列号等信息,方便用户进行资产管理。具体资产管理操作请参见《npu-smi命令参考》。 # 5.2 带外管理 Atlas 300T 训练卡 (型号 9000) 提供 SMBUS 接口,支持服务器的带外管理功能。iBMC提供带外管理功能,包括资产信息及监控Atlas 300T 训练卡 (型号 9000) 的温度、电压、实时功耗及芯片监控状态等信息。同时 iBMC 能够接管 Atlas 300T 训练卡 (型号 9000) 的对应告警信息。 - Atlas 300T 训练卡 (型号 9000)的具体带外管理功能请参见配套服务器的《iBMC用户指南》。 - Atlas 300T 训练卡 (型号 9000)的具体告警信息请参见配套服务器的《iBMC告警处理》。 # 6 # 通过认证 表 6-1 通过的认证 <table><tr><td>序号</td><td>国家/地区</td><td>认证</td><td>标准</td></tr><tr><td>1</td><td>Europe</td><td>CE</td><td>Safety:EN 62368-1:2014+A11:2017EN60950-1:2006+A11:2009+A1:2010+A12:2011+A2:2013EMC:EN 55032:2015EN 55032:2015/A11:2020EN 55024:2010EN 55024:2010+A1:2015EN 55035:2017EN 55035:2017/A11:2020 ETSIEN 300 386 V1.6.1:2012ETSI EN 300 386 V2.1.1:2016EN 61000-3-2:2014EN IEC 61000-3-2:2019EN IEC 61000-3-2:2019/A1:2021EN 61000-3-3:2013EN 61000-3-3:2013/A1:2019RoHS:EN IEC 63000:2018</td></tr><tr><td>2</td><td>Europe</td><td>RCM EMC</td><td>EN 55032:2015EN 55032:2015/A11:2020CISPR 32:2015CISPR 32:2015/AMD1:2019EN 55024:2010EN 55024:2010+A1:2015EN 55035:2017EN 55035:2017/A11:2020CISPR 35:2016ETSI EN 300 386 V1.6.1:2012ETSI EN 300 386 V2.1.1:2016VCCI-CISPR 32:2016AS/NZE CISPR 32:2015+A1:2020*IEC 61000-3-2:2014IEC 61000-3-2:2018IEC 61000-3-2:2018+ADM1:2020EN 61000-3-2:2014EN IEC 61000-3-2:2019EN IEC 61000-3-2:2019/A1:2021*IEC 61000-3-3:2013IEC 61000-3-3:2017EN 61000-3-3:2013EN 61000-3-3:2013/A1:2019</td></tr><tr><td>3</td><td>Europe</td><td>FCC EMC</td><td>FCC CFR47 Part 15 Subpart B</td></tr><tr><td>4</td><td>Europe</td><td>ICES EMC</td><td>ICES-003 Issue 7: 2020ICES Gen Issue 1: 2018</td></tr><tr><td>5</td><td>UK</td><td>UKCA</td><td>Safety:BS EN 62368-1:2014+A11:2017EMC:EN 55032:2015EN 55032:2015/A11:2020EN 55024:2010EN 55024:2010+A1:2015EN 55035:2017EN 55035:2017/A11:2020ETSI EN 300 386 V1.6.1:2012ETSI EN 300 386 V2.1.1:2016EN 61000-3-2:2014EN IEC 61000-3-2:2019EN IEC 61000-3-2:2019/A1:2021EN 61000-3-3:2013EN 61000-3-3:2013/A1:2019RoHS:BS EN IEC 63000:2018</td></tr><tr><td>6</td><td>Europe</td><td>RoHS</td><td>EN IEC 63000: 2018 & BS EN IEC 63000: 2018</td></tr><tr><td>7</td><td>Europe</td><td>VEEE</td><td>2012/19/EU</td></tr><tr><td>8</td><td>-</td><td>多国商检</td><td>参考产品认证证书</td></tr></table> # 7 维保 详细信息请参见《维保与保修信息》。 缩略语 <table><tr><td colspan="3">A</td></tr><tr><td>AI</td><td>Artificial Intelligence</td><td>人工智能</td></tr><tr><td colspan="3">B</td></tr><tr><td>iBMC</td><td>Baseboard Management Controller</td><td>主板管理控制单元</td></tr><tr><td colspan="3">C</td></tr><tr><td>CFM</td><td>Cubic Feet Per Minute</td><td>立方英尺每分钟</td></tr><tr><td colspan="3">E</td></tr><tr><td>ECC</td><td>Error Checking and Correction</td><td>误差核对与改正</td></tr><tr><td colspan="3">O</td></tr><tr><td>OS</td><td>Operating System</td><td>操作系统</td></tr><tr><td colspan="3">P</td></tr><tr><td>PCIe</td><td>Peripheral Component Interconnect Express</td><td>快捷外围部件互连标准</td></tr><tr><td colspan="3">S</td></tr><tr><td>SMbus</td><td>System Management Bus</td><td>系统管理总线</td></tr></table>