> **来源:[研报客](https://pc.yanbaoke.cn)** # RK182X 详细总结 ## 核心内容 RK182X 是瑞芯微推出的一款面向 AIoT 2.0 的端侧 AI 芯片,旨在实现设备“听懂、看懂、思考”,提升智能硬件的交互体验与功能表现。该芯片结合了先进的 3D 堆叠技术和优化的 NPU 设计,解决了传统端侧设备在性能、功耗、带宽、成本和生态等方面的瓶颈问题。 ## 主要观点 - **AIoT 2.0 的目标**:让设备具备更高级的感知、理解、推理和交互能力,从“遥控器”向“私人管家”、“副驾伙伴”、“专属秘书”等角色转变。 - **端侧部署的必要性**:为满足隐私、实时性、带宽、可靠性等需求,端侧部署成为趋势。 - **3D 堆叠技术**:通过将 DRAM 晶圆直接堆叠在 NPU 逻辑晶圆上,显著提升带宽和降低功耗,实现高性能、低能耗的 AIoT 设备。 - **算力解耦**:主控与协处理器分离,灵活配置,降低升级成本,提升系统扩展性。 - **大模型性能提升**:支持多种大模型类型(如 LLM、VLM、CNN、ViT 等),并通过量化、模型优化等手段保持精度。 ## 关键信息 ### 产品特性 | 项目 | 内容 | |------|------| | **3D DRAM** | 提供超高带宽(数百 GB/s),降低能耗,提升推理性能 | | **NPU 设计** | 支持 Transformer 架构与 Attention 机制,适配大模型推理 | | **性能指标** | RK182X 支持 3B 模型推理输出 100+ TPS,实现远高于普通 SoC 的性能 | | **带宽与能耗** | 与传统 LPDDR4/5 相比,带宽提升数量级,能耗降低一个数量级 | | **灵活配置** | 支持主控+协处理器模式,满足不同场景需求,提升性价比 | ### 模型支持 - **LLM(大语言模型)**:Qwen 2.5-3B、Qwen 3-4B、Qwen 3-8B、GLM Edge、Hunyuan-MT1.5、Youtu-LLM 等 - **语音模型**:SenseVoice、Whisper 等 - **多模态/视觉语言模型(VLM)**:Qwen2.5-VL-3B/7B、Qwen3-VL-2B/4B、GELab-Zero、InternVL3、MiniCPM-V-4、FastVLM 等 - **视觉类模型**:ViT、CNN(如 YOLOv5/V6/V8、ResNet50V2、DINOv2/v3、Depth-Anything-V2-small 等) ### 性能实测 | 模型 | 输入长度 | 输出长度 | 首字时延(ms) | 输出速度(TPS) | |------|----------|----------|----------------|----------------| | Qwen 2.5-3B | 128 | 128 | 83.09 | 100.75 | | Qwen 2.5-7B | 128 | 128 | 158.28 | 69.37 | | Qwen 3-4B | 128 | 128 | 106.58 | 86.87 | ### 模型精度保持 | 模型类别 | 模型名称 | 数据集 | 考察重点 | 原始精度 | RKNN3 精度 | 数据类型 | |----------|----------|--------|----------|----------|-----------|----------| | LLM | Qwen3-4B | GSM8k | 数学能力 | 90.6 | 89.84 | W4A16 | | LLM | Qwen3-4B-Instruct | IFEval(strict) | 指令遵循 | 88.73 | 90.42 | W4A16 | | LLM | Qwen3-4B-Instruct | BFCL(avg) | 函数调用 | 84.94 | 85.34 | W4A16 | | VLM | InternVL3.5-4B | MMBench(cn) | 图片理解 | 78.69 | 77.41 | W4A16 | | CNN | YOLOv8s | Coco2017 | 目标检测 | 0.39 (AP@0.5:0.95) | 0.380 | W8A8 | | CNN | ResNet50V2 | Imagenet | 图片分类 | 0.729 (Top1) | 0.721 | W8A8 | ### 开发工具 - **RKNN3 SDK**:支持模型从验证、转换、仿真到部署的全流程开发 - **RKNN3 Toolkit(PC Tool)**:提供模型量化、转换、精度分析、模拟器等功能 - **RKNN3 Runtime**:支持 Python、C/C++、OpenAI 接口等用户层 API ### 应用场景 - **智能家居**:自动管理设备、了解家庭成员习惯、生成老幼报告 - **智能车载**:成员识别、自然交互、任务规划 - **智能办公**:自动翻译、总结、提醒待办事项 - **智能机器人**:场景识别、情绪分析、任务规划 - **智慧家庭**:事件检索、视频搜索、自动时光缩影 - **智慧厂区**:规范操作预警、劳保用品穿戴检测 - **智慧交通**:事故自动发现、拥堵原因分析 - **智慧零售**:门店热力图、客流排队分析、员工动线分析 ## 总结 RK182X 是一款突破性的端侧 AI 芯片,通过 3D 堆叠技术和 NPU 设计,解决了传统端侧设备在带宽、功耗、精度和生态方面的挑战。它支持多种大模型,具备高推理性能和低能耗特性,适用于智能家居、智能车载、智能办公、智能机器人等多种 AIoT 场景。通过主控+协处理器模式,实现算力解耦和灵活配置,降低升级成本,提升系统性价比。RKNN3 SDK 提供完整的开发路径,支持模型转换、精度仿真、部署优化等流程,推动 AIoT 2.0 生态发展。