> **来源:[研报客](https://pc.yanbaoke.cn)** 通信 发布时间:2026-02-18 证券研究报告/行业深度报告 优于大势 上次评级:优于大势 # 端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇 # 报告摘要: AI端侧从概念到落地,基础设施重构驱动产业格局演变。随着AI规模化应用带来的算力成本激增、能耗压力加大、网络延迟及隐私安全等问题日益凸显,传统的集中式云端处理模式面临根本性瓶颈。在此背景下,能够实现低延迟、高隐私、弱网可用、个性化的端侧AI成为破局关键。未来,通过“云-边-端”协同的混合架构,在速度、隐私、成本与智能之间实现最优平衡,AI基础设施将逐步落地。 终端形态持续创新,AI耳机与AI眼镜引领商业化浪潮。在众多终端形态中,AI耳机凭借其“贴身无感、语音交互”的天然优势,成为人机交互核心入口,2025年中国市场规模预计突破580亿元,年复合增长率达 $28\%$ 。而AI眼镜则作为“空间计算的视觉入口”,融合AR技术与AI算法,在消费导航、工业辅助、医疗教育等领域展现出巨大潜力,2025年第三季度全球出货量同比增长 $74.1\%$ 。此外,AI玩具凭借情感陪伴与场景化教育功能,正打破年龄边界,向全龄段拓展,预计2030年中国市场规模将达850亿元。这些终端不仅是硬件产品,更是数据采集、服务触达与生态构建的关键节点。 全球科技巨头加速布局,构建软硬一体的端侧生态闭环。谷歌通过自研TPU芯片、轻量化模型Gemini Nano、AI Edge Gallery应用及Android XR平台,打造从算力底座到终端体验的全栈式生态;OpenAI以65亿美元收购硬件公司IO,积极探索从“模型提供商”向“硬件入口+生态平台”的转型,推出首款AI硬件,预计两年内量产;字节跳动依托豆包大模型,通过收购Oladance推出AI耳机、研发AI手机、布局MR眼镜等,构建“模型-应用-硬件”的闭环体系。端侧AI的竞争已从单一产品比拼升级为生态协同能力与场景落地深度的综合较量。 产业链迎来结构性机遇,芯片、整机与核心部件环节显著受益。端侧AI的爆发为产业链上下游带来明确增长动能:1)芯片环节作为端侧AI的“大脑”,具备高技术壁垒,专注于低功耗、高能效的端侧NPU芯片企业将核心受益;2)整机制造与代工环节凭借规模化生产与供应链管理能力,有望承接巨头订单红利;3)声学/光学模组作为终端创新的关键部件,其性能直接决定用户体验,技术领先的模组供应商成长空间广阔。 风险提示:技术迭代与路线风险;行业竞争加剧风险;生态构建失败风险;供应链与地缘政治风险;用户接受度与隐私风险。 历史收益率曲线 <table><tr><td>涨跌幅 (%)</td><td>1M</td><td>3M</td><td>12M</td></tr><tr><td>绝对收益</td><td>1%</td><td>18%</td><td>82%</td></tr><tr><td>相对收益</td><td>3%</td><td>19%</td><td>62%</td></tr></table> 行业数据 <table><tr><td>成分股数量(只)</td><td>124</td></tr><tr><td>总市值(亿)</td><td>39531</td></tr><tr><td>流通市值(亿)</td><td>37082</td></tr><tr><td>市盈率(倍)</td><td>28.98</td></tr><tr><td>市净率(倍)</td><td>2.53</td></tr><tr><td>成分股总营收(亿)</td><td>25348</td></tr><tr><td>成分股总净利润(亿)</td><td>2071</td></tr><tr><td>成分股资产负债率 (%)</td><td>41.92</td></tr></table> # 相关报告 《Meta Compute计划启动,环旭深化光通信布局》 --20260121 《英伟达发布Rubin架构,旭创展示光纤上车》 --20260112 《SemiAnalysis 详解 CPO, 世嘉科技进军光模块》 --20260105 《Marvell推出金缆计划,CPO市场前景广阔》 --20251229 证券分析师:陈建森 执业证书编号:S0550525040001 chenjs3@nesc.cn # 目录 # 1. AI浪潮下基础设施重构 4 1.1. 目前发展现状:从概念验证到硬件爆发 1.2.AI从云端转向终端 4 1.2.1. 云端瓶颈凸显,成本与体验难以兼顾 1.2.2. 为什么端侧是大趋势 1.3. 未来趋势:云-边-端相结合 # 2. 端侧AI崛起:从云端智能到场景智能的范式转移 8 2.1. 端侧AI的定义与发展背景 8 2.2. 终端VS云端 2.3. 产业链与市场规模 ..... 10 2.4. 生成式AI加速向终端渗透,AI耳机与AI眼镜引领商业化……12 2.4.1. AI耳机:贴身AI助理的终极载体 14 2.4.2. AI眼镜:空间计算的视觉入口 15 2.4.3.AI玩具:情感陪伴与场景化教育 17 2.4.4. AIPC/手机/汽车/机器人等 19 # 3. 全球科技巨头端侧战略布局 22 3.1. 谷歌:全栈式AI生态与端侧服务闭环 22 3.1.1. 自研TPU芯片,构建算力底座 22 3.1.2. Gemini Nano: 轻量化模型赋能设备端智能 23 3.1.3.AI Edge Gallery:端侧模型部署 25 3.1.4. 谷歌AndroidXR终端产品布局 26 3.2. OpenAI: 模型能力下沉,探索硬件入口 ..... 27 3.2.1. 以GPT模型为基础,转向集成和调用三方应用的超级平台 ..... 27 3.2.2. 推出首款AI硬件,预计两年内量产 27 3.3. 字节跳动:内容反哺硬件,构建场景化AI闭环 28 3.3.1.上下游全面布局,构建软硬一体的AI生态 28 3.3.2. AI 硬件多元化探索:从 MR 眼镜到 AI 手机 29 3.3.3. Ola Friend 耳机:语音交互与场景服务的硬件载体 29 # 4. 相关受益标的 30 5. 风险提示 31 # 图表目录 图1:基准情景下全球数据中心电力消耗(2020-2030) 5 图2:按设备类型和数据中心类型划分的数据中心总电力消耗(2005-2024) 6 图3:云-边-端架构 图4:端侧AI产业链 10 图5:端侧AI消费终端结构 11 图6:2020-2025年中国智能终端市场规模预测趋势图 11 图7:2018-2028E年中国端侧AI行业市场规模(亿元) 12 图8:中国AI大模型用户规模(2025.01-2025.11) 13 图9:海外AI大模型用户规模(2025.01-2025.11) 13 图10:生成式AI在软件+硬件方面应用 14 图11:全球智能眼镜市场出货量(2024Q3-2025Q3) 17 图12:中国智能眼镜市场出货量(2024Q3-2025Q3) 17 图13:2024-2030年中国AI玩具市场规模预测趋势图(亿元) 18 图14:AIPC通用场景下的个性化服务 19 图15:AI手机渗透率(2024-2029F) 20 图16:中国L2+智能辅助驾驶渗透率预测 22 图17:AICore管理模型、运行时间和安全功能 25 图18:XR头戴设备GalaxyXR. 26 图19:OpenAI首款AI硬件 28 表 1: 近期 AI 终端硬件关键进展时间线 表 2:云-边-端各层功能及应用 表 3: 六大主流手机 AI 芯片厂商旗舰 SoC 及工艺情况 表 4: AI 端侧部署需求 表 5: 全球 AI 应用月活跃用户量 (2025 年 12 月数据) 表 6: AI 眼镜产品分类 ..... 15 表 7: 2024-2025 年发布的 AI 眼镜 表 8: 主流厂商 AIPC 产品. 19 表 9: 2024-2026 年全球 AIPC 市场份额和出货量 ..... 20 表 10: 2024-2025 年发布的 AI 手机. 21 表 11: 设备端和云端对比 ..... 24 # 1. AI浪潮下基础设施重构 # 1.1.目前发展现状:从概念验证到硬件爆发 当前,AI基础设施的重构已进入关键阶段,其焦点正从集中式的云端算力扩张,迅速转向分布式、场景化的终端智能落地。端侧AI已超越技术概念,进入密集的硬件产品化周期,成为科技巨头争夺下一代交互入口的主战场。这一趋势的直接体现是,消费电子与智能出行领域的头部厂商在近期集中发布了新一代AI原生硬件,它们不再仅仅是手机或眼镜的智能化升级,而是以“贴身AI助理”和“空间视觉入口”为定位,旨在重构人机交互范式。2025年11月27日,阿里巴巴正式发布了旗下首款自研的夸克AI眼镜,该产品融合了通义千问大模型,旨在将AI助手从屏幕延伸至物理世界。 表 1: 近期 AI 终端硬件关键进展时间线 <table><tr><td>时间</td><td>厂商</td><td>产品/事件</td><td>关键信息</td></tr><tr><td>2025年11月27日</td><td>阿里巴巴</td><td>发布夸克AI眼镜S1</td><td>正式推出搭载阿里千问大模型的AI眼镜,主打视觉识别、实时翻译等功能,标志着其AI助手首次从屏幕走向现实空间。</td></tr><tr><td>2025年12月1日</td><td>字节跳动</td><td>豆包AI手机助手及努比亚M153工程样机</td><td>豆包主导AI手机助手的产品定义与体验,中兴通讯旗下努比亚则负责硬件研发设计及生产制造</td></tr><tr><td>2025年12月3日</td><td>理想汽车</td><td>发布AI眼镜“Livis”</td><td>内置“理想同学智能体”,支持车控功能;构建“车-镜-人”协同生态,切入具身智能</td></tr><tr><td>2025年12月9日</td><td>谷歌&XREAL</td><td>计划2026年推出全球首款搭载Android XR平台以及Gemini AI的消费级AR眼镜产品Project Aura</td><td>AR眼镜Project Aura产品深度整合Gemini AI,支持实时翻译、视觉搜索等功能,采用高通骁龙XR2芯片,配备三摄像头和Micro OLED显示屏</td></tr></table> 数据来源:东北证券整理 # 1.2. AI从云端转向终端 回顾AI发展历程,早期受限于芯片算力、模型规模与能耗约束,AI能力主要集中于云端。然而,随着芯片工艺进步、轻量化模型技术突破,AI能力正加速向终端侧迁移。这一转变不仅是技术路径的升级,更源于云端中心化模式在落地时面临的根本性瓶颈,而终端侧基础设施的成熟使其成为破局关键。 # 1.2.1. 云端瓶颈凸显,成本与体验难以兼顾 随着AI规模化应用,训练与推理所产生的海量算力需求驱动了全球算力规模高速增长,但也导致资本开支与能耗呈指数级攀升。此外,传统云端存在带宽资源有限、网络延迟高、隐私泄露风险等问题,发展瓶颈逐渐显现。 # 经济成本高企,资本开支大幅增加 全球算力规模持续高速稳定增长,全球科技巨头加大AI基础设施领域投资。经中国信通院测算,2023年全球计算设备算力总规模为1397EFlops,增速达 $54\%$ ,预计未来五年全球算力规模仍将以超过 $50\%$ 的速度增长,至2030年全球算力将超过16ZFlops,其中智能算力占比将超过 $90\%$ 。AI技术的落地高度依赖大模型训练与推理所产生的海量算力需求,引爆了以GPU为核心的算力硬件板块,资本开支大幅增 加。麦肯锡的研究显示,到2030年,全球数据中心预计需要6.7万亿美元来满足计算能力的需求。根据Canalys的数据,2025年全球基础设施即服务和平台即服务(IaaS和PaaS)的支出达到909亿美元,较上一年增长 $21\%$ 。激增主要是由于企业将工作负载迁移到云端并采用高度依赖计算资源的人工智能。 运行前沿大模型需要强大的算力基础设施,尤其是昂贵的GPU集群。大模型推理成本十分高昂:1)硬件采购成本起点很高且持续累积。NVIDIA H100 GPU每张卡售价25,000-40,000美元,包含基础设施的完整8-GPU服务器系统达到200,000-400,000美元。2)云端GPU租赁价格趋于稳定。即便选择云端租赁,主流云厂商的H100实例时租也集中在2.85至3.50美元,这还未包含为支撑高功耗芯片所需的额外电力和冷却成本,后者可能使运营总成本再增加每小时2-7美元。3)更关键的是,显存而非算力往往先成为瓶颈。在处理长上下文或高并发请求时,用于存储中间计算结果(KV Cache)的显存会急剧膨胀,导致昂贵的GPU资源因内存不足而无法满载运行,造成显著的资源浪费与单位成本上升。 产业层面的供需紧张与生态压力正在推高成本。2026年1月23日,亚马逊云科技(AWS)宣布对其机器学习容量块服务实施约 $15\%$ 的价格上调。其中,p5e.48xlarge实例的每小时费用,从34.61美元直接涨至39.80美元,而该服务此前长期保持价格稳定。谷歌云于2026年1月27日宣布,自2026年5月1日起,对Google Cloud、CDN Interconnect、Peering以及AI与计算基础设施服务的价格进行调整,其中北美地区单价从0.04美元/GiB翻倍至0.08美元/GiB,涨幅达 $100\%$ 。在人工智能算力需求持续激增、硬件及能源等上游成本结构性上升的背景下,主流云服务商正逐步将系统性成本压力向终端传导,行业长期以来的降价趋势出现关键转折。 # 能耗问题凸显 智算基础设施的电力成本和设备成本显著增加。根据中国信通院发布的《智算基础设施发展研究报告》,据相关智库测算,使用英伟达GPU集群组成的微软超算数据中心训练一次GPT-3模型消耗的电量约为19万度,按照全国电力平均二氧化碳排放因子 $0.5568\mathrm{kgCO2 / kWh}$ 计算,相当于间接排放二氧化碳 $105792\mathrm{kg}$ ,大型智算基础设施耗电量更是惊人。以10万GPU集群为例,功率超过150MW,一年的耗电量近16亿度。此外,据lama3团队公开信息显示,训练过程中一大挑战就是电力,数万张GPU卡同时高负荷运行会给数据中心电力带来极强的压力,有时候其电力需求甚至高达数十兆瓦,超出了电网的极限。IEA预计到2030年,在基准情景下,数据中心的全球电力消耗将达到约945太瓦时,比2024年估计的约415太瓦时增加了一倍多。从2024年到2030年,数据中心的电力消耗每年增长约 $15\%$ ,增长速度是其他所有行业总电力消耗增长的四倍多。 图1:基准情景下全球数据中心电力消耗(2020-2030) 数据来源:IEA,东北证券 图2:按设备类型和数据中心类型划分的数据中心总电力消耗(2005-2024) 数据来源:IEA,东北证券 # 带宽资源有限、网络延迟高、隐私泄露风险问题 终端设备规模庞大,每天产生大量的实时数据,如果将海量数据都上传至云服务器进行计算,将占用大量的网络带宽资源。云计算模式下,终端设备将数据上传至云服务器进行处理,由于云计算中心与用户的距离较远,集中式的网络架构可能会造成性能瓶颈,导致网络时延高,云服务质量下降。另外,大数据时代,终端数据经常会涉及个人隐私,直接上传至云端处理将带来很高的隐私泄露风险。 # 1.2.2. 为什么端侧是大趋势 2025年7月28日上午,在世界人工智能大会(WAIC)智能体驱动产业变革论坛上,中国信通院发布2025智能体十大关键词,其中包含“端侧智能体”,端侧智能体是运行在移动设备、IoT设备、PC等端侧设备上的智能体,强化本地推理、隐私保护与实时响应能力,能够实现离线感知、个性推荐、环境自适应与快速反馈等功能,具备响应速度快、网络依赖低、安全程度高等优点。未来,端侧智能体将进一步强化安全隐私、提升计算推理效能、增强交互自然性和情境理解能力,成为“万物智联”时代的重要入口和关键计算节点。 # 端侧推理的优势: > 隐私保护。在大模型时代,模型可能利用端上产生的几乎所有数据,包括录音、文本、输入、屏幕点击等,因此隐私问题比以往更为突出。端侧智能的本地化数据处理能力使得生物特征等敏感信息能够在设备端完成特征提取与初步分析,从而在源头上降低数据传输风险,为数据提供者与数据处理者构建起基于技术信任的协同生态环境。 > 可用性、实时性:端侧推理可以摆脱网络依赖,提升可用性,即使离线也能运行。同时,它避免了云端serving的网络往返延迟(RTT)和批量调度带来的时延问题。例如,机器视觉作为智能制造的典型场景,需要上行带宽超过50Mbps甚至200Mbps,端到端通信时延小于10ms,可靠性要求大于 $99.9999\%$ 。这一趋势正从根本上颠覆长期以来“云重边轻”的模式,推动终端与边缘从被动的“数据采集器”转变为主动的“智能体”。 成本低:从企业角度看,将计算分摊到用户终端,可以减少维护超大GPU集群的成本,这也是强有力的商业动机。 > 个性化:通过利用本地数据,端侧大模型能够根据用户的使用习惯和需求进行实时调整和优化,从而提供更精准的个性化服务。 > 数据获取能力:在端侧能以无感伴随的方式,持续收集从唤醒、交互到任务完成的全链路连续数据;端侧设备集成了麦克风、摄像头、各类传感器,保障数据的连续性、原始性、实时性和隐私安全性,极大提升了数据的整体质量与价值密度。 # 1.3. 未来趋势:云-边-端相结合 未来发展趋势是“混合AI”(Hybrid AI),通过端-边-云协同,在速度、隐私、成本和智能之间取得最佳平衡。通过网络连接多个节点(端设备、边缘服务器或云数据中心)协同工作,实现计算能力的扩展与并行化,有效降低核心网带宽压力。云-边-端协同架构出现,结合三层优势——云(大规模计算、全局洞察)、边(低延迟、本地化处理)、端(数据采集、初步分析),且边缘-云 continuum愿景逐步实现,软件组件可跨层级无缝迁移。 图3:云-边-端架构 数据来源:侯祥鹏等《边缘智能与协同计算:前沿与进展》,东北证券 表 2:云-边-端各层功能及应用 <table><tr><td>架构层级</td><td>核心功能</td><td>关键优势</td><td>典型应用场景</td></tr><tr><td>云层(Cloud Layer)</td><td>集中式计算、大规模数据存储、复杂AI模型训练(如LLMs)、全局数据聚合分析</td><td>算力强、存储容量大、支持跨区域协同</td><td>长期数据归档、大规模模型训练(如智能交通流量预测模型)</td></tr><tr><td>边缘层(Edge Layer)</td><td>本地化数据处理、实时推理、任务卸载中转、数据预处理与过滤</td><td>低延迟、减少网络带宽占用</td><td>自动驾驶实时障碍物检测、工业设备实时状态分析</td></tr><tr><td>终端层(Terminal Layer)</td><td>物理环境数据采集(温度、图像等多模态数据)、初步数据处理(清洗、特征提取)、设备控制(如执行器)</td><td>贴近物理世界、实时数据采集、低能耗(简单处理)</td><td>智能温控器采集温度并计算平均值、智能灌溉传感器监测土壤湿度</td></tr></table> 数据来源:Jiaqi Wu.et al.“A Survey on Cloud-Edge-Terminal Collaborative Intelligence in AIoT Networks”, ColaHub, 东北证券 # 2. 端侧AI崛起:从云端智能到场景智能的范式转移 # 2.1. 端侧AI的定义与发展背景 大模型技术经历了参数竞赛与生成能力的突破后,行业焦点已从纯粹的“模型能力”转向“落地能力”。回顾人工智能近年来的发展,其主战场正经历一次深刻的转移。随着技术逐渐趋于同质化,AI的下一步竞争,不再是“谁的模型更强”,而是“谁真正拥有用户”。算力、电力、存储等基础层设施逐步完善后,AI技术亟需突破“实验室到现实”的困境,从纯粹的数字计算走向对物理世界的实时感知与交互。在此背景下,终端设备作为AI连接现实世界的唯一物理接口,自然成为产业链下一阶段的核心战略焦点。如果说大模型是新一代智能的“大脑”,那么硬件就是它们的“身体”与“接口”。谁掌握了用户的入口,谁就掌握了数据、反馈、互动与生态构建的主动权。 在WAIC2025上,联想集团副总裁阿不力克木·阿不力米提抛出“新摩尔定律”:端侧智能正以“算力+模型能力”双螺旋模式实现指数级跃升,这将彻底重构终端产业的价值链。 端侧AI,即直接在终端设备(如手机、耳机、眼镜、个人电脑等)上部署和运行AI模型的技术路径,它通过轻量化模型与专用硬件的结合,使数据在设备端就能完成从感知、推理到执行的闭环,无需事事都依赖云端服务器。在物理世界场景中,终端设备正是承接文字、语音、图像、环境温湿度、空间位置等多模态数据的核心载体,其天然具备“随身携带、实时采集、场景适配”的独特优势,每增加一位终端用户,就相当于为大模型增加了一个24小时不间断采集三维世界数据的“智能触角”。这种数据的独占性、实时性与场景多样性,构成了比传统互联网“网页流量”更具战略价值的稀缺资源。传统流量仅能反映用户数字行为,而终端采集的多模态数据可完整还原用户物理场景需求。 全球科技巨头已敏锐洞察到这一趋势。1)OpenAI以65亿美元收购硬件初创公司IO,被视为其战略重心从“云端模型”转向“物理硬件”的关键转折。2)字节跳动凭借豆包大模型与OlaFriend耳机等硬件,快速构建“终端采集-模型训练-服务反馈”的生态闭环。3)夸克AI眼镜正式发布,首发提供S1、G1两个系列共六款单品,均搭载阿里最新的千问AI助手。这标志着阿里千问首次走出屏幕,进入物理世界。我们认为,这些动作均印证了终端卡位的战略必然性。 DeepSeek 掀起生成式 AI 技术革命,轻量化模型推动端侧 AI 时代全面到来。DeepSeek 的突破不仅重构了 AI 产业的价值评估体系,更通过“低成本+高性能”的创新范式,为行业提供了提升投资回报率(ROI)的全新路径。传统生成式 AI 大模型长期受困于“高投入-低产出”的 ROI 悖论,而 DeepSeek 通过算法革新和工程优化,将训练成本压缩,从根本上破解了这一困局: > DeepSeek开创的混合专家架构(MoE)使6710亿参数大模型的单激活参数量仅为370亿,显著降低计算负载与显存占用,让中小企业在消费级硬件上部署大模型成为可能; > 其开源的R1系列蒸馏模型(如1.5B版本)仅需1.1GB内存即可运行,推动AI玩具、智能眼镜等产品的功能智能化跃升。3)DeepSeek提供了一些轻量化及蒸馏模型,针对参数量更小的场景。 在硬件层面,终端芯片同样正在经历面向AI的升级,为端侧AI的发展奠定基础。2025年5月22日小米发布玄戒O1自研芯片;华为海思的麒麟9020手机芯片自研泰山大小核彻底摆脱Arm架构,彻底实现了CPU、GPU的全部自研和国产化,麒 麟9030采用中芯国际的‘N+3’工艺,先进程度逐步逼近国际主流水平。高通、联发科、苹果等主流厂商将专用神经网络处理单元(NPU)作为旗舰芯片的标配,算力呈现指数级增长。2025年9月,联发科MediaTek发布天玑9500,实现多项智能体AI应用,涵盖多模态交互、实时翻译、个性化助手等场景,携手生态伙伴推动AI体验从概念走向日常。高通将在今年9月发布骁龙8系新平台——骁龙8EliteGen6和骁龙8EliteGen6Pro,这两颗芯片都采用台积电2nm制程N2P,是高通首款2nm芯片。 表 3:六大主流手机 AI 芯片厂商旗舰 SoC 及工艺情况 <table><tr><td>厂商</td><td>旗舰 SoC</td><td>工艺制程</td></tr><tr><td>苹果</td><td>A18 Pro</td><td>台积电第二代 3nm</td></tr><tr><td>华为</td><td>麒麟 9030</td><td>中芯国际(SMIC)改进版 7 纳米工艺“N+3”</td></tr><tr><td>高通</td><td>骁龙 8 Elite</td><td>台积电第二代 3nm</td></tr><tr><td>联发科</td><td>天玑 9500</td><td>台积电第三代 3nm</td></tr><tr><td>小米</td><td>玄戒 O1</td><td>台积电第二代 3nm</td></tr><tr><td>三星</td><td>Exynos 2500</td><td>三星 3nm GAA</td></tr></table> 数据来源:智东西等,东北证券 # 2.2. 终端VS云端 与传统的云端AI相比,端侧AI有几个突出优势: > 低延迟与实时响应:数据在设备本地处理,消除了网络传输延迟,能满足智能驾驶、实时翻译等对瞬时性要求极高的场景。 隐私保护增强:敏感数据(如人脸、语音)在本地处理,避免了上传云端可能带来的泄露风险。 > 弱网或离线可用:不依赖网络连接,在无网或弱网环境下仍能稳定工作。 $\succ$ 计算负载分散:缓解云端数据中心的计算压力和能耗,更加绿色经济。 当然,它也存在短板: > 算力与功耗的平衡:设备本地算力有限,高性能AI任务会产生大量热量,对芯片的能效和散热技术提出了极高要求。 > 场景碎片化:不同物联网设备功能千差万别,需要“量身定制”的AI算法和芯片,难以一套方案走天下。 因此,AI端侧部署的必然性由用户需求和产业需求共同决定。从用户角度来说,用户要实时性、隐私安全、全时服务以及个性化服务的需求,从产业需求角度来说,企业要降成本减少云端负载、拓场景如离线AI、以及建生态如硬件升级溢价+服务订阅的需求,因此将AI布局在端侧而非完全依赖云端,是技术演进与用户需求的必然选择。 表 4: AI 端侧部署需求 <table><tr><td colspan="2">核心驱动力</td><td>具体问题/需求</td><td>端侧解决方案与价值</td></tr><tr><td rowspan="4">用户需求</td><td>实时性</td><td>云端延迟,无法满足即时交互</td><td>本地推理,提升体验流畅度</td></tr><tr><td>隐私安全</td><td>数据云端传输泄露风险高</td><td>生物/金融数据本地处理,合规性保障</td></tr><tr><td>弱网/离线场景</td><td>部分移动场景网络不稳定(电梯/野外)</td><td>无网环境仍提供基础智能服务</td></tr><tr><td>个性化服务</td><td>云端无法私有化学习用户习惯</td><td>本地数据训练专属模型,动态优化行为策略</td></tr><tr><td>产业需求</td><td>成本优化</td><td>云端推理成本高</td><td>端侧处理高频任务,降低云负载与带宽成本</td></tr></table> 数据来源:华强电子产业研究所,东北证券 # 2.3.产业链与市场规模 端侧AI产业已形成覆盖全价值链的完整生态体系。上游以AI芯片、存储、电源、传感器、通信模块等硬件及操作系统、数据库等基础软件构成核心技术支撑层;中游由具备模型优化、硬件适配和系统集成能力的设备商提供从底层硬件到上层应用的一体化解决方案;下游则通过行业解决方案和软硬件产品服务满足多元化应用需求,形成了从技术研发到产品落地的高效协同产业链。 图4:端侧AI产业链 数据来源:智研咨询,东北证券 端侧AI产业正迎来爆发式增长,其市场规模和终端渗透率呈现指数级扩张态势。根据最新研究数据,2023年全球存量消费终端设备已达228亿台,其中智能手机 $(29.8\%)$ 、智能家居设备( $26.3\%$ )和PC/PAD( $17.6\%$ )构成主要载体。尽管早期端侧AI技术已在智能安防和车载设备领域实现初步应用,但真正规模化发展始于2023年,随着手机和PC两大亿级终端全面AI化,行业进入高速增长通道。基于DIGITIMES在2025年11月的统计,2025年全球GenAI手机逾4.2亿台,2026年全球出货预计接近至6亿台;2025年全球智能手机出货量约为12.213亿台,较2024年增长 $2.3\%$ 。 根据产业世界报告预测,全球智能终端行业在2025年进入新一轮整合期,市场规模突破1.8万亿美元,年复合增长率稳定在 $9\%$ 以上。中国作为最大单一市场,贡献全球 $35\%$ 的出货量,其中可穿戴设备和AR/VR终端增速显著,分别达到 $28\%$ 和 $40\%$ 。IDC预计,2026年中国智能终端市场出货量将超过9亿台,同比增长 $4\%$ ,传统AI终端出货量超过3亿台;2027年传统AI终端渗透率将超过 $93\%$ ,2029年传统AI终端渗透率将接近 $97\%$ 。根据中商产业研究院的分析,2024年中国智能终端市场规模达到16.69万亿元,近五年年均复合增长率达 $7.16\%$ ;2025年中国智能终端市场规模将达到17.53万亿元。 图5:端侧AI消费终端结构 数据来源:华为AI终端白皮书,东北证券 图6:2020-2025年中国智能终端市场规模预测趋势图 数据来源:中商产业研究院,东北证券 从市场规模看,中国端侧AI产业2023年规模不足2000亿元,但预计到2028年将突破1.9万亿元,2023-2028年复合增长率(CAGR)高达 $58\%$ 。这一增长动力主要来自三个方面: 1)硬件性能突破:算力持续突破,支持百亿参数模型本地部署; 2)应用场景拓展:除开智能终端以外,工业4.0与智慧城市等领域对端侧AI的需求持续增长; 3)政策支持:国家"十五五"规划将端侧AI纳入数字经济核心产业。 图7:2018-2028E年中国端侧AI行业市场规模(亿元) 数据来源:头豹,东北证券 # 2.4. 生成式AI加速向终端渗透,AI耳机与AI眼镜引领商业化 生成式AI技术正加速从云端向终端设备渗透,软件+硬件持续迭代,推动端侧产品的功能革新与体验升级。在软件应用层面,AI技术已深度渗透至办公、创意、金融等多个垂直领域,AI应用产品已有不错表现。根据Xsignal发布的《2025年全球AI应用行业年度报告》,2025年11月,海外市场AI应用月活用户突破15亿,年度增长率飙升至 $79.30\%$ ;中国市场月活增长至5.44亿,年度增长率为 $130.19\%$ 。海外AI大模型竞争格局方面,ChatGPT以超6.4亿用户规模领先,OpenAIMAU突破11亿,个人订阅是主要驱动力;Grok和MetaAI通过巨头渠道快速扩张,生态分发红利凸显。中国方面,豆包在泛众生活领域,DeepSeek在专业生产力领域占据优势,构成第一梯队;元宝借助腾讯社交网络快速扩张,千问通过阿里电商和办公生态实现流量增长。 表 5: 全球 AI 应用月活跃用户量 (2025 年 12 月数据) <table><tr><td>AI 应用</td><td>月活跃用户量(万)</td></tr><tr><td>ChatGPT</td><td>88,496</td></tr><tr><td>豆包</td><td>16,316</td></tr><tr><td>夸克</td><td>14,784</td></tr><tr><td>DeepSeek</td><td>13,148</td></tr></table> 数据来源:AI产品榜,东北证券 图8:中国AI大模型用户规模(2025.01-2025.11) 数据来源:Xsignal,东北证券 图9:海外AI大模型用户规模(2025.01-2025.11) 数据来源:Xsignal,东北证券 在硬件产品层面,生成式AI技术的快速发展正在重塑硬件产业生态,各类智能终端设备通过集成AI能力实现功能升级与体验革新。当前主流硬件产品形态主要包括AI可穿戴设备(耳机、眼镜)、AI玩具、AIPC、AI手机、AI汽车、AI机器人等,其技术成熟度与市场表现呈现显著差异。 图10:生成式AI在软件+硬件方面应用 数据来源:东北证券整理 端侧硬件设备作为AI应用落地的物理载体,扮演着至关重要的双重角色:它既是AI技术实现的基础设施,也是连接用户与智能服务的首要入口。AI模型好比系统的"大脑",而各类终端设备则构成了感知环境和交互用户的"神经末梢"。这种架构决定了真正的AI应用必须突破云端限制,通过实体设备成为用户日常生活中触手可及的智能伙伴。 # 2.4.1. AI耳机:贴身AI助理的终极载体 终端设备的场景化落地已从“概念验证”阶段迈入规模化爆发前夜,其中AI耳机与AI眼镜凭借“轻量化形态、高频交互、低使用门槛”的核心优势,成为率先实现商业化落地的核心场景。 AI耳机高速增长,全球及中国市场规模持续扩张。据最新行业数据IIM信息测算,2025年全球AI耳机市场规模预计将突破120亿美元,年增长率维持在 $45\%$ 以上。中国市场表现尤为突出,凭借成熟的供应链、活跃的资本投入以及庞大的用户基础,预计2025年市场规模将占据全球份额的 $35\%$ ,成为全球创新与竞争的核心舞台。中国AI耳机耳麦在传统电商平台2024年销量达31.5万副,同比增长 $260.9\%$ ;2025年第一季度销量达38.2万副,同比增长 $960.4\%$ ,预计2025年全年销量将达152.7万副,同比增长超3倍。AI耳机国内竞争格局方面,主要有两类企业:一类是以字节跳动、百度、讯飞等为代表的AI模型平台企业,试图借助耳机切入C端场景,绑定用户使用习惯。另一类则是小米、华为、荣耀等智能终端厂商,将AI耳机纳入生态体系,通过软硬一体化扩展服务场景。 AI耳机的核心技术逻辑是构建“端侧轻量化处理+云端深度计算+端侧即时反馈”的协同架构,实现多模态数据的实时交互处理。根据产业调研,我们认为未来AI耳机可能会突破现有形态: > 硬件层面采用“全栈集成”设计,除传统声学部件外,新增微型高清摄像头(分辨率达1080P)、6麦克风阵列、心率/运动传感器及高性能端侧AI芯片,其中摄像头负责采集物体图像、场景画面等视觉数据,麦克风通过降噪算法捕捉清晰语音指令与环境音,端侧芯片实现数据压缩、降噪预处理及10ms内低延迟响应,再通过5G/Wi-Fi6将核心数据传输至云端大模型进行深度分析; > 软件层面通过大模型实现语音识别、图像识别、语义理解等多模态数据的融合处理,最终以语音播报、音频反馈等直观形式输出给用户。 # 目前AI耳机应用场景已深度覆盖消费与工业两大领域: > 消费端可实现跨语言实时翻译、场景化智能服务(如旅游讲解)、健康管理、老年陪护等; 工业端则赋能远程运维指导、语音控制作业等。 # 产品表现方面: > 关键技术指标持续突破。语音指令识别准确率已超 $98\%$ ,智能翻译支持38种语言互译且错误率低于 $2\%$ ,医疗级健康监测误差率小于 $3\%$ ,脑电波控制响应时间达0.8秒。 设备互联体验提升。例如华为鸿蒙设备互联率达 $82\%$ 。情境化语音广告等创新应用已带来点击率 $300\%$ 的提升。 # 2.4.2.AI眼镜:空间计算的视觉入口 AI眼镜是一种将人工智能技术与传统眼镜形态融合的智能穿戴设备,通过集成多种传感器、处理器和智能算法,实现对环境和用户指令的感知、理解与交互。随着AI大模型、AR显示、微型传感与边缘计算的融合突破,AI眼镜正以更成熟的姿态进入大众视野。依据典型功能,AI眼镜产品类型可分为AI音频眼镜、AI拍摄眼镜、 $\mathrm{AI + AR}$ 眼镜等。 表 6: AI 眼镜产品分类 <table><tr><td>AI眼镜类型</td><td>主要硬件构成</td><td>眼镜重量</td><td>功能特点</td><td>代表产品</td></tr><tr><td>AI音频眼镜</td><td>音频、无线通讯等基础模块</td><td>≈普通眼镜</td><td>语音交互</td><td>界环AI音频眼镜、李未可City AI眼镜等</td></tr><tr><td>AI拍摄眼镜</td><td>基础模块+摄像头</td><td>>普通眼镜</td><td>语音交互+视觉识别</td><td>Ray-Ban Meta、雷鸟V3、闪极AI拍拍镜等</td></tr><tr><td>AI+AR眼镜</td><td>基础模块+显示屏(+摄像头)</td><td>>>普通眼镜</td><td>语音交互+信息提示(+视觉识别)</td><td>INMO GO2、StarV Air2、雷鸟X3 Pro等</td></tr></table> 数据来源:量子位智库,东北证券 # AI眼镜热潮爆发,大厂纷纷入场布局。 > 2025年6月24日,Rokid和蓝思科技联合开发的AI+AR眼镜RokidGlasses全球首台量产版正式下产线,实现全产业链国产化突破。 2025年6月26日,在小米人车家全生态发布会上,小米首款AI眼镜正式发布。 > 2025年11月10日,百度旗下小度AI眼镜Pro正式开售。 >2025年11月27日,阿里发布了夸克AI眼镜S1、G1两个系列共六款单品 > 2025年12月3日,理想汽车发布了理想AI眼镜Livis,将理想汽车AI智能体验从车内延伸至车外的重要载体,更是理想向“成为全球领先的人工智能终端企业”战略迈进的重要组成部分。 表 7: 2024-2025 年发布的 AI 眼镜 <table><tr><td>年份</td><td>厂商</td><td>代表机型</td><td>起售价</td><td>AI核心卖点</td></tr><tr><td rowspan="9">2025</td><td>华为</td><td>Eyewear 3</td><td>¥1,899</td><td>基于盘古大模型的语音理解、智能摘要、AI语音助手、情绪识别、健康监测(姿态/疲劳检测);支持小艺多模态交互</td></tr><tr><td>小米</td><td>xiaomi AI glasses</td><td>¥1,999</td><td>搭载超级小爱,支持语音拍照、录像,还可以通过摄像头识别物体、翻译文本,以及摄像头扫码支付</td></tr><tr><td>理想</td><td>Livis</td><td>¥1,999</td><td>聊天、答疑解惑、深度研究学术报告、行业报告;强大的车控功能</td></tr><tr><td>阿里</td><td>夸克 AI 眼镜 S1、G1 系列</td><td>¥3799 ¥1899</td><td>深度接入千问,应用在办公、旅游、智能导航等场景中;行业首创双电池可换电设计</td></tr><tr><td>百度</td><td>小度 AI 眼镜 Pro</td><td>¥2,299</td><td>拍照、听歌识曲、智能匹配歌单、AI 翻译、AI 识物、AI 备忘、AI 录音</td></tr><tr><td>雷鸟</td><td>V3 Slim</td><td>¥3,799</td><td>更轻量(舒适佩戴)、AI 实时翻译、字幕、AI 语音交互、消息提醒;兼容华为、小米生态</td></tr><tr><td>XREAL</td><td>One Pro</td><td>¥4,299</td><td>高性能 AR/Al 视觉追踪、手势/头部追踪、空间映射;支持本地 AI 问答与多模态交互</td></tr><tr><td>Rokid</td><td>AR Lite Pro</td><td>¥2,899</td><td>本地 AI 算法识别、AI 语音助手、会议转录与字幕显示、跨设备协作</td></tr><tr><td>Meta</td><td>Ray-Ban Display</td><td>¥4,999</td><td>AR 信息叠加、导航提示、实时语音交互、内容生成、健康监测、拍照/视频录制优化</td></tr><tr><td rowspan="5">2024</td><td>华为</td><td>Eyewear 2</td><td>¥1,699</td><td>集成 HarmonyOS AI 语音助手“小艺”;支持语音控制、信息播报、智能提醒、健康监测</td></tr><tr><td>雷鸟</td><td>X3 Pro</td><td>¥5,499</td><td>搭载骁龙 AR2、AI 空间识别、语音/手势交互、内容识别、导航;兼容华为、小米生态</td></tr><tr><td>XREAL</td><td>Air 2 Pro</td><td>¥2,599</td><td>支持空间显示与头部追踪;AI 场景识别与手势交互,兼容国产手机生态</td></tr><tr><td>Rokid</td><td>Max Pro</td><td>¥4,499</td><td>支持 AI 语音助手、空间音频、实时字幕翻译;内置独立 AI 处理单元</td></tr><tr><td>Meta</td><td>Ray-Ban Stories 2nd Gen</td><td>¥2,799</td><td>拍照/录制视频、骨传导音频播放、语音助手控制、与社交平台分享、日常佩戴智能化</td></tr></table> 数据来源:华强电子产业研究所等,东北证券 AI眼镜的核心技术原理是基于增强现实(AR)技术与AI算法的深度融合,构建“环境感知-数据处理-虚实融合显示”的全流程交互体系: > 硬件层面:集成高分辨率光学显示模块(如Micro-OLED,像素密度超3000PPI)、多维度环境感知传感器(TOF摄像头、惯性测量单元、地磁传感器)及高性能AI处理芯片,其中TOF摄像头可实现厘米级空间定位,惯性测量单元实时捕捉头部运动轨迹; 技术层面:通过端侧AI芯片快速完成SLAM(同步定位与地图构建)预处理,实现对环境的实时建模与定位,随后将核心数据传输至云端大模型完成场景识别、对象分析、语义匹配等深度任务,最终通过光学镜片将虚拟信息(文字、图像、动画)精准叠加至现实场景中,实现“虚实共生”的交互体验。 # 应用场景多样: > 消费端可提供沉浸式导航、智能办公辅助、娱乐互动(AR场景交互); 行业端则在专业领域实现深度赋能,如应用于医疗(手术辅助)、物流(仓储管理)、零售(智能导购)等领域。 # 市场规模扩大,智能眼镜市场出货量持续攀升。 > 全球市场方面,根据国际数据公司(IDC)最新发布的《全球智能眼镜市场季度跟踪报告》,2025年第三季度全球智能眼镜(Smart Eyewear)市场出货量429.6万台,同比增长 $74.1\%$ 。其中全球音频和音频拍摄眼镜市场出货量299.4万台,同比增长 $287.5\%$ ;AR/VR市场出货130.2万台,同比下滑 $23.2\%$ 。 > 中国市场方面,2025年第三季度中国智能眼镜(SmartEyewear)市场出货量62.3万台,同比增长 $62.3\%$ 。其中中国音频和音频拍摄眼镜市场出货量45.4万台,同比增长 $79.2\%$ ;AR/VR市场出货量16.9万台,同比增长 $29.4\%$ 。IDC预测,2026年中国智能眼镜(SmartEyewear)市场出货量预计达到450.8万台,同比增长 $77.7\%$ ,其中音频和音频拍摄眼镜出货量预计343.4万台,同比增长 $68.1\%$ ;AR/VR设备出货量预计107.3万台,同比增长 $62.1\%$ 。2025年全年,根据洛图科技(RUNTO)数据,全球智能眼镜(包含AR眼镜)市场的出货量为681万台,同比增长 $156\%$ ;中国智能眼镜(包含AR眼镜)市场的出货量为145.4万台,同比增长 $211\%$ 图11:全球智能眼镜市场出货量(2024Q3-2025Q3) 数据来源:IDC,东北证券 图12:中国智能眼镜市场出货量(2024Q3-2025Q3) 数据来源:IDC,东北证券 未来,智能眼镜市场AI应用落地进程将进一步加快,竞争转向生态构建与场景落地。多家头部企业密集发布新款智能眼镜,巨头的战略性布局不仅带动了技术创新和产品迭代,也进一步推动智能眼镜向下一代智能交互入口方向演进。未来AI眼镜竞争焦点转向生态协同、内容整合和场景落地等多维度较量。2025年三季度中国智能眼镜市场端侧支持AI的产品占比达到 $35.7\%$ 、接入大模型的产品占比达到 $53.9\%$ 。主流芯片平台已具备较强的AI算力,能够支持语音识别、图像处理等多模态AI功能,硬件层面的技术瓶颈已基本消除。未来,行业关注重点将逐步从AI接入率转向AI能力的实际落地和用户体验优化。 # 2.4.3.AI玩具:情感陪伴与场景化教育 AI玩具是“AI+玩具”的融合产品。与传统的玩具产品相比,AI玩具通过搭载大型模型,可以通过语音识别、图像识别、自然语言处理、深度学习、情感分析等技术,实现交互和反馈,提供个性化的学习和娱乐体验。在使用体验方面,相较于传统智 能玩具,AI玩具凭借大模型支持,拥有多模态交互、情感理解与反馈、智能学习等优势。各大厂相继入局, >2025年11月20日,京东京造宣布预售搭载JoyInside系统的AI毛绒玩具; 2025年11月25日,华为发布与珞博智能联合开发的首款陪聊机器人“智能憨憨”; 2025年12月1日,优必选推出了AI陪伴产品“优惠”。 # AI玩具市场规模不断扩大,增速较快。 1)全球市场:2022年全球AI玩具市场规模为87亿美元,预计2025年市场规模将达到135亿美元,2030年将突破351.1亿美元,CAGR为 $16\%$ 2)中国市场:根据中商产业研究院,2024年中国AI玩具市场规模约为246亿元。中商产业研究院分析师预测,2025年中国AI玩具市场规模将增至290亿元,2030年增至850亿元。竞争格局方面,我国AI玩具行业竞争格局呈现多元化,主要涵盖四类企业: > 传统玩具公司:奥飞娱乐、实丰文化、高乐股份等企业凭借制造能力与IP资源,加速布局AI玩具领域,借助“科技+IP”模式提升溢价。 > 科技创业公司:HAIVIVI、FOLOTOY等将焦点置于细分场景,如情感陪伴、交互等,通过软硬件融合及大模型适配,打造差异化产品以占据市场。 > 互联网科技公司:字节、百度、科大讯飞等凭借大模型等技术优势,广泛覆盖智能玩具、教育工具等应用场景,推动行业发展 > 具有IP储备公司:汤姆猫、上海电影等依托丰富的IP储备探索与IP高度融合的AI玩具。 图13:2024-2030年中国AI玩具市场规模预测趋势图(亿元) 数据来源:中商产业研究院,东北证券 # AI玩具的核心优势: $\succ$ 形态多样:从预编程电子玩具到具备多模态交互能力的智能体。 > 交互能力强:从按钮指令到支持情感计算的自然对话与个性化记忆,AI玩具通过语音识别、情感计算等先进技术实现更真实的互动体验。 > 应用场景丰富:AI玩具的应用场景从儿童娱乐扩展到全龄段的情感陪伴与教育。契合儿童“教育+娱乐”双重需求的产品,适配Z世代偏好的情感陪伴潮玩,服务老年群体的记忆助手,AI玩具凭借多模态交互、情感计算等技术,打破传统玩具的场景边界。 # 2.4.4. AIPC/手机/汽车/机器人等 AIPC:自2023年概念提出以来,AIPC已完成从技术验证到规模落地的跨越。AIPC能够针对工作、学习、生活等场景,提供个性化创作服务、私人秘书服务、设备管家服务在内的个性化服务。据英特尔称,NPU是自定义地为加速AI工作量而建造的,在不依赖"云"的情况下在当地高效地在设备上。 图14:AIPC通用场景下的个性化服务 数据来源:联想《AIPC产业(中国)白皮书》,东北证券 表 8: 主流厂商 AIPC 产品 <table><tr><td>厂商</td><td>产品</td><td>亮点</td></tr><tr><td>华硕</td><td>2026酷睿 Ultra AI PC</td><td>✓搭载"小硕知道"AI助手,与智谱AI合作,单句指令启动全链路自动化工作流程✓内置 Auto GLM 模型,能在本地完成文档生成、数据分析等复杂任务✓创新点:陶瓷铝材质机身,轻至1.19kg,薄至1.1cm,性能与颜值双在线</td></tr><tr><td>惠普</td><td>EliteBoard G1a</td><td>✓将完整PC集成在12毫米厚的键盘中,彻底颠覆传统PC形态✓内置 AMD RyzenAI 处理器,提供50TOPS算力,无需主机就能独立工作</td></tr><tr><td>联想</td><td>ThinkBook Plus Gen 7</td><td>✓屏幕可AI驱动自动旋转,追踪用户面部,自动调整方向和亮度✓搭载 Qira 智能体,能智能编排任务,自动选择本地或云端处理,节省算力成本30%+</td></tr><tr><td>微软</td><td>Copilot+ PC</td><td>✓搭载专用NPU,支持每秒40万亿次运算,是普通PC的数十倍✓内置 Copilot+,能实现"回忆"(搜索历史操作)、"创作"(生成图像)、"会议增强"等功能✓一键启动 Copilot,自然语言操控整个PC生态系统</td></tr><tr><td>六联智能</td><td>AMD 锐龙 AI 400 系列</td><td>✓全球首批完成AMD锐龙AI400系列(代号"Gorgon Point")全品类产品研发与制造的ODM/OEM企业✓覆盖笔记本、迷你盒子、一体机、台式机及主板等多元终端形态,将AI算力赋能于各类设备✓内置六联智能自研AI助手与EAM企业智能体管理平台,支持断网环境下的AI处理,毫秒级响应</td></tr><tr><td></td><td></td><td>✓ 亮点:Deepseek 全家桶系列,基于 AMD Strix Halo 平台,从个人端 7B 模型到企业端 671B 模型全覆盖,完全摆脱对云端算力依赖</td></tr></table> 数据来源:产业数字化时代,东北证券 根据IDC最新数据,截至2025年Q1,搭载40TOPS及以上NPU算力的AIPC出货量为24.1万台,占国内笔记本市场的 $5.3\%$ ,较2024年Q4季度份额( $1.4\%$ )提升近4倍。Gartner分析师预测,2026年AIPC出货量将达到1.43亿台,占整个PC市场的 $55\%$ ,并且AIPC将在2029年成为常态。核心厂商如联想、华为通过异构计算架构(CPU+GPU+NPU)实现本地化AI任务处理,支持智能办公、创意设计等场景。例如,联想 Yoga Slim 7x可基于端侧大模型自动生成多语言会议纪要,显著提升生产力效率。 表 9: 2024-2026 年全球 AIPC 市场份额和出货量 <table><tr><td></td><td>2024</td><td>2025E</td><td>2026E</td></tr><tr><td>AI PC 占 PC 市场的份额(%)</td><td>15.6</td><td>31.0</td><td>54.7</td></tr><tr><td>AI 笔记本电脑占笔记本电脑市场的份额(%)</td><td>19.4</td><td>35.7</td><td>58.7</td></tr><tr><td>AI 台式电脑占台式电脑市场的份额(%)</td><td>3.8</td><td>16.4</td><td>42.1</td></tr><tr><td>AI PC 总出货量(千台)</td><td>38,145</td><td>77,792</td><td>143,113</td></tr></table> 数据来源:Gartner(2025年8月),东北证券 AI手机:根据IDC的定义,AI手机是能够更快更高效地运行设备生成式人工智能(GenAI)模型的设备,使用能够更快更高效地运行设备生成AI模型的SoC,并且配备至少30TOPS性能的NPU,采用int-8数据类型。2024年为AI手机元年,全年渗透率从 $3\%$ 跃升至 $22\%$ ,其中国产品牌占据 $90\%$ 以上市场份额。华为、小米等厂商通过端云协同架构,在影像增强(如AI降噪、4K补帧)、智能助手(如语音指令复杂任务)等领域实现突破。根据Canalys的分析,2024年AI手机渗透率为 $18\%$ 预计2029年将达到 $57\%$ ,端侧模型的精简以及芯片算力的升级将进一步助推AI手机向中端价位段渗透。2025年芯片厂商发布的新款次旗舰SoC,如Snapdragon8sGen4,Dimensity9400e已经具备了流畅运行端侧大模型的能力,Deepseek的出现也在很大程度上降低了大模型对于芯片算力的开销,在这两大因素的共同作用下,2025-2026年AI手机仍预计会保持高速渗透的趋势。 图15:AI手机渗透率(2024-2029F) 算力升级与模型精简将推动AI手机渗透 数据来源:Canalys(2025年5月),东北证券 表 10: 2024-2025 年发布的 AI 手机 <table><tr><td>年份</td><td>厂商</td><td>代表机型</td><td>起售价</td><td>AI核心卖点</td></tr><tr><td rowspan="5">2025</td><td>苹果</td><td>iPhone 17 系列</td><td>¥7,999(128GB)</td><td>Apple Intelligence 升级,跨域客 AI 协同,支持 AI 录音转写+通话实时翻译</td></tr><tr><td>三星</td><td>Galaxy S25 系列</td><td>¥5,999(12+256GB)</td><td>骁龙 8 至尊版,Gemini 本地模型,AI 影像生成式编辑,AI 翻译即用即收</td></tr><tr><td>华为</td><td>Mate XTs 三折叠</td><td>¥12,999(12+256GB)</td><td>盘古大模型 3.5+海棠 Next, AI 卷传交互,AI 实时翻译,AI 云增强品质</td></tr><tr><td>小米</td><td>小米 17 系列</td><td>¥2,499(8+256GB)</td><td>AI 动画 3.0,A 模组,AI 人像精修,澎湃 OS 3人车家全生态 AI 意图识别</td></tr><tr><td>OPPO</td><td>Find X9 系列</td><td>¥3,999(12+256GB)</td><td>AndesGPT 2.0, AI15秒 Vlog4K 生成,AI 通话摘要+跨 App 服务一键直达</td></tr><tr><td rowspan="5">2024</td><td>苹果</td><td>iPhone 16 系列</td><td>¥5,999(128GB)</td><td>Apple Intelligence 系统级上线,AI 写作,AI 图清理,自定义 emoji 全部免费</td></tr><tr><td>三星</td><td>Galaxy S24 系列</td><td>¥5,999(12+256GB)</td><td>Galaxy AI 套件:即用即收、笔记助手摘要、通话实时翻译,内置百度/美团大模型</td></tr><tr><td>华为</td><td>Pura 70 系列</td><td>¥5,999(12+256GB)</td><td>麒麟 9010+盘古 3.5,AI 消除,AI 扩图,AI 高动态云增强;小艺助手支持 1.2M 长文本摘要</td></tr><tr><td>小米</td><td>小米 15 系列</td><td>¥4,499(12+256GB)</td><td>AI 动画 2.0,一句话生成 4K 海报;澎湃 OS 2人车家全场景技术,跨域软件 1 秒定位</td></tr><tr><td>OPPO</td><td>Find X8 系列</td><td>¥4,199(12+256GB)</td><td>小布助手多模态 2.0,一键同屏+跨 App 操作,AI 视频生成 15 秒 4KVlog</td></tr></table> 数据来源:华强电子产业研究所,东北证券 智能汽车:生成式AI在汽车领域主要应用于自动驾驶与座舱交互。蔚来NOMIGPT实现跨语言实时传译,选装率提升至 $58\%$ ;大众全系车型接入ChatGPT,优化导航与娱乐功能;汽车已在自动驾驶的长年探索中逐步使用生成式AI技术。端侧AI通过在本地设备(如车载芯片、传感器)上运行AI模型,解决了传统依赖云端计算的延迟问题,使智能汽车终端具备实时感知、决策和执行能力。例如,高通推出的“至尊版汽车平台”通过端侧NPU(神经网络处理器)和Transformer加速器,实现了毫秒级的环境感知与路径规划,显著提升了自动驾驶的安全性和响应效率。此外,端侧AI的本地化处理能力降低了对网络的依赖,即使在信号不佳的场景下,车辆仍能自主完成复杂任务,如障碍物识别、车道保持等。这种“端-云协同”架构不仅优化了算力分配,还通过边缘计算减少了数据上传的隐私风险,为智能汽车终端构建了高效、安全的底层技术支撑。未来,随着AI算法迭代、高算力芯片普及及多模态感知技术成熟,L3及以上高级别自动驾驶正加速从实验室研发向规模化商业应用迈进。根据摩根士丹利的预测,L2+级智能驾驶将成为普及型功能,渗透率将在2026年达到 $32\%$ ,2030年超过 $50\%$ (2025年为 $25\%$ )。 图16:中国L2+智能辅助驾驶渗透率预测 中国L2+智能辅助驾驶渗透率预测 Source: NE Times, Morgan Stanley Research estimates (E) 数据来源:Vehicle,东北证券 机器人:机器人尚处商业化早期,但细分领域如医疗陪护、工业检测已取得进展。生成式AI通过多模态数据训练(如视觉、语言、触觉),使机器人能够动态解析环境并生成最优行动策略。生成式AI可合成大量高保真训练数据,解决机器人领域真实数据稀缺问题。通过大语言模型(如GPT-4),机器人能理解自然语言指令并生成上下文相关的响应。通过集成AI与机器人技术的实体载体,不仅能自主学习优化行为模式,还能灵活应对各类场景需求。从医疗康复到商业服务,从导览接待到零售营销,其应用版图正在快速扩张,成为推动行业智能化转型的核心力量。特别是在服务机器人领域,其自主决策和环境适应能力正不断突破传统自动化设备的局限。 # 3. 全球科技巨头端侧战略布局 # 3.1.谷歌:全栈式AI生态与端侧服务闭环 谷歌AI全栈式布局,覆盖基础设施-终端-平台。谷歌坚持“AI优先”的战略目标与全面布局,采取“全端式”(Full-Stack),旨在从最底层的实体基础设施,如自研的TPU芯片与服务器,到技术研发,再到终端产品与平台的部署,打造先进AI所需的一切环节。 # 3.1.1. 自研TPU芯片,构建算力底座 谷歌早在2015年启动TPU项目,以应对其搜索、广告等谷歌核心服务所面临的需求。谷歌ASIC的目标不仅仅是成为“最强通用芯片”,更是成为“可大量部署在数据中心、用于特定矩阵运算的高能效芯片”。 TPU v1:在2016年正式投入使用,用于支持谷歌翻译以及部分搜索功能,证明了ASIC方案具备可行性。 TPUv2、v3:逐步开放给云客户,正式进入商业化阶段。 TPU v4: 2021年,谷歌正式进入超大规模AI时代,通过TPU v4 Pod完成PaLM540B模型训练。 TPU v5p:2023-2024年,首次大规模进入谷歌广告系统、搜索核心排序、YouTube推荐、地图实时预测等赚钱产品线,性能较v4翻倍,同时推出弹性节点架构,可以按需扩展至近9000颗芯片的规模。 TPU v6: 2024年发布,v6从架构到指令集全部围绕推理负载重新设计,FP8吞吐暴涨、片上SRAM容量翻倍、KV Cache访问模式深度优化、芯片间带宽大幅提升,能效比上一代提升 $67\%$ TPU v7:2025年发布,锁定超大规模在线推理场景,在多项关键指标上首次与英伟达Blackwell系列实现正面交锋。2025年10月23日,AI初创公司Anthropic宣布与谷歌达成合作,将部署多达100万个谷歌的TPU芯片以训练旗下AI大模型Claude。 TPUv8:预计将于2026年下半年发布,包含2个版本:1)与Broadcom联合设计的TPU8AX;2)与MediaTek联合设计的TPU8X,将与英伟达的Vera Rubin竞争。TPU8AX仍然使用N3E节点布局,包含2颗计算芯片、1颗I/Ochiplet,以及8组12-Hi HBM3E速率为9.6Gbps,相比TPUv7在内存带宽上提升约 $30\%$ # 3.1.2. Gemini Nano: 轻量化模型赋能设备端智能 在将AI/ML功能集成到Android应用时,一项重要的早期决策是,是在用户设备上直接执行处理,还是在云端执行处理。Google的MLKit、Gemini Nano和TensorFlowLite等工具可实现设备端功能,而内含Firebase AI Logic的Gemini云端API可提供强大的云端处理能力。设备端可以实现AI在离线状态下运行、最大限度地保护数据隐私(将用户数据保留在设备端),并且没有云端推理费用,节约成本。 > 连接性和离线功能:如果应用需要在没有互联网连接的情况下可靠运行,Gemini Nano等设备端解决方案非常适合。云端处理本身就需要网络访问权限。 > 数据隐私:对于出于隐私保护原因而必须将用户数据保留在设备上的用例,设备端处理可将敏感信息保留在本地,从而具有明显的优势。 > 模型功能和任务复杂性:基于云的模型通常更大、更强大,并且更新频率更高,因此适用于高度复杂的AI任务,或者在处理较大输入时(更高的输出质量和广泛的功能至关重要)也非常适用。设备端模型可能会妥善处理更简单的任务。 > 费用注意事项:CloudAPI通常采用按用量计费的价格模式,这意味着费用可能会随推理次数或处理的数据量而扩缩。虽然设备端推理通常不会产生直接的按使用付费费用,但会产生开发费用,并且可能会影响设备资源(例如电池续航时间和整体性能)。 设备资源:设备端模型会占用用户设备上的存储空间。此外,了解特定设备端模型(例如Gemini Nano)的设备兼容性也很重要,以确保目标受众群体能够使用这些功能。 > 微调和自定义:基于云的解决方案可以使用户根据特定用例微调模型,提供更大的灵活性和更广泛的自定义选项。 > 跨平台一致性:如果需要在包括iOS在内的多个平台上提供一致的AI功能,某些设备端解决方案(例如Gemini Nano)可能尚未在所有操作系统上推出。 表 11: 设备端和云端对比 <table><tr><td>对比维度</td><td>设备端(Gemini Nano / ML Kit / TFLite)</td><td>云端(Gemini Cloud API + Firebase)</td></tr><tr><td>联网需求</td><td>没有互联网连接可靠运行</td><td>需要网络访问权限</td></tr><tr><td>数据隐私</td><td>可将敏感信息保留在本地</td><td>隐私性差</td></tr><tr><td>模型功能和任务复杂性</td><td>处理简单任务</td><td>模型更大、更强大、更新频率高,适用于复杂任务/处理较大输入</td></tr><tr><td>使用费用</td><td>不按使用付费,但会产生开发费用、会影响设备资源</td><td>按用量计费</td></tr><tr><td>设备资源</td><td>占用设备存储空间</td><td>云空间,不占用设备空间</td></tr><tr><td>微调和自定义</td><td>灵活性弱</td><td>灵活性强</td></tr><tr><td>跨平台一致性</td><td>差</td><td>优</td></tr></table> 数据来源:Android Developers,东北证券 Google的Gemini是一系列基础性大语言模型,拥有不同规模的模型——Ultra、Pro、Flash和Nano,优化支持从数据中心到智能手机等各种设备。谷歌正以Gemini系列大模型为核心,大力押注“代理式AI”(AgenticAI)的未来。从Gemini1在原生多模态处理上的突破,到Gemini2奠定代理能力的基础,直至最新Gemini3系列模型的推出,谷歌正不断提升AI的深度推理、多模态理解和自主任务执行能力。 Gemini Pro 和 Gemini Flash 模型是基于云端的 Gemini AI 模型。为 Android 开发者提供多模态 AI 功能,在 Android 应用中处理图片、音频、视频和文本输入内容。Gemini 2.5 Pro 是 Google 最先进的思维模型,能够使用长上下文对代码、数学和 STEM 领域的复杂问题进行推理,并分析大型数据集、代码库和文档。Gemini Flash 模型具备新一代特性和改进功能,包括卓越的速度、内置工具使用和 100 万个 token 的上下文窗口。 Gemini Nano是谷歌为设备端任务打造的最高效模型。直接运行在移动硅片上,支持了多种重要应用场景。在设备内运行支持数据不应离开设备的功能,例如端到端加密消息应用中建议回复消息。它还能实现稳定的延迟体验,即使没有网络,功能也始终可用。Gemini Nano是从较大型的Gemini型号中提炼而成,并专门优化用于移动硅加速器。支持高质量文本摘要、上下文智能回复以及高级校对和语法纠正等强大功能。 ML Kit 的生成式 AI API 利用 Gemini Nano 的强大功能,通过简化的更高级别接口,为常见任务提供开箱即用的性能。这些 API 基于 Android 系统服务 AICore 构建,可在设备端执行 AI 基础模型(例如 Gemini Nano),通过在本地处理数据来增强应用功能并提升用户隐私保护水平。 MLKit的生成式AIAPI支持以下功能: √ 总结:以项目符号列表的形式总结文章或对话。 校对:校对简短的聊天消息。 √ 重写:以不同语气或风格重写简短的聊天消息。 √ 图片说明:生成指定图片的简短说明。 提示:根据自定义的纯文本提示或多模态提示生成文本内容。 Gemini Nano 在 Android 的 AICore 系统服务中运行,该服务利用设备硬件实现低推理延迟并确保模型保持最新状态。Android AICore 是 Android 14 中的一项新系统服务,方便访问 Gemini Nano。AICore 负责模型管理、运行时、安全功能等,简化了用户将 AI 融入应用的工作。AICore 设计上是私有的,借鉴了 Android 的私有计算 核心,通过开源API与网络隔离,提供透明度和可审计性,另外还设计了专门的安全功能。 图17:AICore管理模型、运行时间和安全功能 数据来源:Android Developers,东北证券 谷歌推出首款为 Gemini Nano 设计的智能手机 Pixel 8 Pro,利用谷歌 Tensor G3 的强大功能,提供了两项扩展功能:录音机中的摘要和 Gboard 中的智能回复。运行在 Pixel 8 Pro 上的 Gemini Nano 设计上有多项优势,帮助防止敏感数据流出手机,并且能够在无需网络连接的情况下使用功能。 # 3.1.3.AI Edge Gallery:端侧模型部署 2025年9月,谷歌推出了“Google AI Edge Gallery”应用,这款实验性应用允许用户在Android设备上直接运行AI模型,完全摆脱对云端和网络的依赖。用户可以拍照后向AI提问关于图片的内容,或者进行音频转录和翻译,所有这些功能都在设备端运行。应用集成的Gemma3n模型采用创新的Matryoshka Transformer设计,能根据设备性能动态调整模型层级,在节省电量和内存的同时保持高效推理能力。产品功能丰富: $\succ$ 图像识别(Ask Image):用户上传图片或直接拍照后,就能向AI提问相关内容。比如识别物体、描述场景或解答与图像有关的问题,在学习、旅行或日常探索中都非常实用。 > 音频对话(Audio Scribe):支持音频转录和翻译,用户上传或录制音频后,AI可将其转换为文本或翻译成其他语言,会议记录或多语言沟通从此变得轻松。 文字交互(AI Chat & Prompt Lab):提供多轮对话功能,类似ChatGPT的交互体验,同时支持单轮任务,如文本摘要、代码生成和内容改写,能满足用户的多样化需求。 > 模型灵活切换:用户可从HuggingFace等平台下载不同AI模型,并在应用内切换比较性能,开发者还能测试自有LiteRT模型。此外,应用还提供实时性能数据,如首次令牌生成时间(TTFT)和解码速度,让用户直观了解模型效率。 Gemma 3n 是谷歌利用 MatFormer 架构打造的轻量化端侧大模型,借由嵌套式结构实现了低内存消耗设计。Gemma 3n 主要优势: > 多模态设计:Gemma 3n 原生支持图像、音频、视频和文本输入输出,适合移动端测设备。 > 针对设备上优化:Gemma 3n 型号以效率为核心设计,基于有效参数提供两种尺寸:E2B 和 E4B。虽然它们的原始参数数量分别为 5B 和 8B,但架构创新使其能够在与传统 2B 和 4B 型号相当的内存占用下运行,使用内存仅 2GB(E2B)和 3GB(E4B)。 > 开创性的组件:Gemma 3n 的核心包含了创新组件,如 MatFormer 架构以提升计算灵活性,采用 Per Layer Embeddings(PLE) 实现内存效率,LAuReL 和 AltUp 提升架构效率,以及针对设备端应用优化的新型音频和基于 MobileNet-v5 的视觉编码器。 > 提升质量:Gemma3n在多语言能力(支持140种语言的文本和35种语言的多模态理解)、数学、编码和推理方面实现了质量提升。E4B版本的LMArena分数超过1300,成为首个在100亿参数下达到该基准的模型。 # 3.1.4. 谷歌AndroidXR终端产品布局 把Android体验搬到XR平台上,谷歌与三星、高通共同开发全新平台AndroidXR,三星负责技术架构和产品,高通负责芯片。谷歌将AndroidXR定位为“业界首个为扩展现实设备打造的统一平台”,通过AndroidXR统一平台整合硬件、软件与AI,将扩展现实视为一个连续的设备谱系,产品形态多元。 Android XR 的硬件不仅有功能强大、能提供深度沉浸体验的头戴设备;也有轻便时尚、可全天佩戴的 AI 智能眼镜,以及介于两者之间的混合形态设备。 > 混合现实头戴设备GalaxyXR:基于AndroidXR,深度集成谷歌的Gemini人工智能系统。是一款具备环境感知能力的AI驱动装置,能够通过语音、视觉和手势实现自然交互,以更贴近人类直觉的方式协助用户完成各类任务。12月发布会上系统更新,新增虚拟显示器(PCConnect)、数字分身(Likeness)及旅行模式(TravelMode)三大功能。 图18:XR头戴设备GalaxyXR 资料来源:三星官网,东北证券 > 智能眼镜两个型号,计划在2026年推出:与Gentle Monster、Warby Parker合作设计两款智能眼镜,产品体验完全围绕Gemini AI构建,致力于提供一种“情境感知式”的无感协助。一款是注重基础交互的音频版AI智能眼镜,配备先进的微型扬声器阵列、高清摄像头和环境麦克风,用户可以通过自然语音与Gemini进行对话,实现音乐播放、通话沟通、即时拍摄等功能。另一款则是在此基础上进一步集成了一项关键技术——带屏幕——一个微型、低功耗的透明显示屏,能够在用户视野的恰当位置以极高的隐私性显示导航箭头、消息通知、实时翻译字幕等信息。 > 联合XREAL推出有线XR眼镜,预计将于2026年正式推出。ProjectAura,设计核心是分体式架构——眼镜+计算设备,介于头显与AI眼镜之间。ProjectAura既可以作为独立XR,并且拥有谷歌应用生态支持,也可以作为移动设备的外接屏幕,也整合了Gemini的AI能力。 # 3.2. OpenAI:模型能力下沉,探索硬件入口 # 3.2.1. 以GPT模型为基础,转向集成和调用三方应用的超级平台 2024年5月14日OpenAI春季发布会上,OpenAI重点推出新旗舰模型GPT-4o,以及在ChatGPT中免费提供更多功能。该模型多模态交互能力突出,能够接受文本、音频和图像的“混搭”输入,快速响应完成推理,生成文本、音频和图像的组合输出。音频输入层面,GPT-4o击穿了此前Siri等智能语音助手的延迟弊端,取得突破性进展。其响应速度之快,达到了人类级别,至短232毫秒,平均320毫秒。视频输入方面,GPT-4o可以及时响应高管开启摄像头的视频需求指令,实时解决一元方程的数学计算,整个过程同样丝滑迅速。GPT-4o还展示出对图片信息的快速解读能力,用AI读复杂图片正在变为现实。从底层技术分析,GPT-4o的先进之处在于,它革新了传统的多模型串联处理方式,能够通过单一的神经网络统一处理所有的输入和输出,无论是文本、视觉图像还是音频信息,都能得到精准高效的解析和回应。 IDC中国研究总监卢言霞说,“GPT-4o意味着大模型在端侧的落地更进一步。短时间内,肯定是谁的端侧交互能力强,谁就会赢得用户。在中长周期内,后来者也会迎头赶上。应该说,这是端侧与AI助手的双赢,毕竟上游厂商没有精力面向每个场景做优化与工程化,还是需要产业链的协作。” 推出Apps inside of ChatGPT,ChatGPT向操作系统转型。OpenAI在其年度开发者大会DevDay2025上宣布,OpenAI正在推出一种开发者在ChatGPT内部构建应用的新方式。首席执行官Sam Altman说:“我们希望ChatGPT成为人们进步、提高生产力、更具创造力、更快学习、更好地完成生活中想做的事情的绝佳途径。”“Apps inside of ChatGPT将支持新一代互动、适应性和个性化的应用,你可以与之聊天。”它将应用直接置于ChatGPT的响应中,并允许用户在日常对话中调用第三方工具。这为开发者提供了更好的应用分发,旨在为ChatGPT用户带来更丰富的体验。 EIIRTrend & Pareekh Consulting 首席执行官 Pareekh Jain 表示:“这一举措实际上将 ChatGPT 定位为一个 AI 作系统或对话运行时,允许用户在聊天驱动的界面中完全发现、调用并与多个小应用和服务互动。”“它正逐渐接近类似作系统的任务和服务层。”OpenAI 还推出了面向开发者的工具包 Apps SDK 的预览版,它允许开发者构建可在 ChatGPT 中运行的应用程序。应用 SDK 基于开放标准模型上下文协议 (MCP) 构建,使 ChatGPT 能够与外部数据源和工具连接。借助 Apps SDK,开发者将获得全栈访问,包括连接数据、触发作以及呈现完全交互式的用户界面。 # 3.2.2. 推出首款AI硬件,预计两年内量产 2025年5月22日,人工智能行业迎来一笔震撼交易:OpenAI宣布将以近65亿美元(约合人民币468亿元)的全股权交易方式,收购由苹果前首席设计官乔纳森·艾维(JonyIve)创办的硬件初创公司IO。这不仅是OpenAI成立以来最大的一笔并购,更被视为其战略重心从“云端模型”转向“物理硬件”的关键转折。 这项交易的核心目的,不是为了扩充硬件营收渠道,而是为了解决一个更根本的问题——分发。因为模型再强,没有入口也难落地。在生成式AI的早期阶段,谁能训练出参数最多、效果最惊艳的大模型,是竞争的关键。但到了今天,模型之间的差距正在逐渐缩小,AI的“护城河”正从模型本身转向另一个维度:用户入口与应用分发能力。AI硬件不只是执行任务的终端,更是汇聚用户数据、行为反馈、使用频次、支付习惯、生成内容的生态中枢。 据媒体报道,OpenAI首席执行官山姆·奥特曼近日在节目中透露,他与苹果前首席设计师乔纳森联手打造的神秘AI硬件项目取得重大进展——首个原型机已经成功完成,这款产品预计将在两年内投入量产。 > 区别现有智能设备:该产品针对当前智能设备造成的信息过载问题,旨在为用户创造宁静、专注的使用体验。设计上追求极简美观,并融入趣味元素,可能选用陶瓷材质提升质感。 设备定位&形态&功能:设备定位为生活中的“主动参与者”,能基于对用户背景的理解,主动且自然地提供帮助与信息过滤。据推测,它可能是介于手机与笔记本之间的新型便携设备,通过麦克风和摄像头感知环境,并已确定并非传统的眼镜、手表或耳机等可穿戴设备形态。 图19:OpenAI首款AI硬件 数据来源:快科技,东北证券 # 3.3.字节跳动:内容反哺硬件,构建场景化AI闭环 # 3.3.1.上下游全面布局,构建软硬一体的AI生态 在模型、平台、应用、云服务等AI上下游,字节均已实现全面布局,构建了从模型到应用的丰富生态。字节正构建“大模型+超级应用+硬件”的终端AI布局,随着AI手机发布,全栈体系成型:火山引擎(算力)、豆包大模型(模型)、抖音等(应用)、多终端(硬件)。 > 在模型层,2024年字节推出豆包大模型,OPPO、vivo、荣耀、小米、三星、华硕已联合火山引擎发起智能终端大模型联盟,OPPO小布助手、荣耀Magic Book的YOYO助理、小米“小爱同学”,以及华硕笔记本电脑的豆叮AI助手等应用,均已接入豆包大模型服务。字节Seed近期开源了多模态智能体框架M3-Agent,核心亮点在于长期记忆+多模态推理。据其推出的多模态长视频问答基准M3-Bench,M3-Agent的表现优于GPT-4o等多模态模型,在多项测试中实现准确率提升。 > 在应用层,不仅豆包、即梦等多款产品在国内迅速普及;AI教育应用Gauth、聊天助手Cici、智能体开发平台Coze等产品,在海外也已经快速增长。据今年年初的官方信息,Gauth已为全球3亿用户提供教育资源。 # 3.3.2.AI硬件多元化探索:从MR眼镜到AI手机 智能穿戴设备一直是字节重要的战略方向,2021年8月,字节跳动斥资90亿收购VR硬件制造商PICO。2023年11月,PICO宣布组织架构调整,大幅裁员,当时PICO总裁周宏伟表示“我们对行业和市场发展估计得比较乐观,但实际上没有预期的那么快”。在2024年的火山引擎大会上,字节展示了三款联合外部合作开发的AI硬件,分别是机器狗、学习机和学习机器人。 2025年7月,爱范儿从外媒The Information获悉,字节跳动内部正在积极开发一款护目镜形态的“轻量级混合现实设备”,预计将于2027年对外公布。无论是产品功能还是定位,都直直瞄准了AR领域风头正盛的Meta。 根据三名知情人士透露,这款MR设备采用分体式设计——显示设备与主机分离,主机形似冰球,内置计算硬件、电池和自主开发的专用芯片(类似苹果VisionPro的R1芯片),通过数据线连接眼镜部分。产品尺寸与目前世界最小VR头显Bigscreen Beyond相近。爱范儿获悉,该项目由字节旗下Pico团队负责,开发代号“天鹅”(Swan),被视为Pico在VR市场受挫后,向MR领域的战略转型。 字节手机业务始于2024年上半年,中兴努比亚成为合作伙伴,其硬件研发、供应链管理及努比亚的影像、性能调校优势,恰好弥补了字节的硬件短板,可提供从设计到生产的全流程方案。这款AI手机是字节AI硬件的核心成果。CEO梁汝波曾明确2025年AI三大目标,其中“探索新型UI交互”便以AI手机为核心载体。 豆包AI手机于2025年12月1日发布。双方分工明确,字节主导豆包大模型植入及AI交互定义,中兴负责硬件研发、设计及生产。知情人士透露,这款产品,在硬软件及操作系统层实现深度整合重构,被定义为“AI原生手机”(AI Native Phone),区别于当前主流AI手机。其核心优势是高权限智能代理(AI Agent),拥有超普通应用的系统权限,可跨应用执行复杂任务,体验远超“智能手机+AI应用”的传统模式。目前第一代机型已批量交付,备货3万台,发布后即开售;第二代已立项,明年上半年推出,将升级AI能力及硬件配置。 # 3.3.3.OlaFriend耳机:语音交互与场景服务的硬件载体 2024年,字节收购耳机品牌Oladance,后推出AI智能体耳机OlaFriend。Oladance是一家成立于2021年的开放式耳机品牌,由前BOSE高管李浩乾联合多位BOSE工程师创办。Oladance在全球性首次提出OWS(Open Wearable Stereo)专利技术,并于2021年推出全开放式OWS系列耳机,以其无感佩戴、不入耳、音响级声效和超长续航等特点,在海外市场迅速站稳脚跟,获评亚马逊2022年度创新品牌。此次字节跳动收购Oladance,引入了一支经验丰富的前Bose工程师组成的团队,也弥补了在音频技术上的短板。 使用时用户可以通过唤醒词“豆包豆包”或直接触摸耳机来调用豆包的对话功能,而不再需要通过手机 App 手动或语音输入,并且同一上下文多轮对话仅需一次唤醒。借助 Ola Friend,用户可以与豆包 App 建立新的互动模式。 # 4. 相关受益标的 > 恒玄科技:公司核心产品BES2800采用6nm先进工艺,集成蓝牙、Wi-Fi6、NPU等模块,深度绑定小米、华为、Meta等全球头部品牌,批量应用于TWS耳机、智能手表、AI眼镜等场景,出货量达数千万颗。公司持续推进技术迭代,BES6000系列A+M核异构单芯片方案即将推出,专为AI智能眼镜打造,功耗与算力大幅优化,成本优势显著。凭借先进制程、高集成度方案与优质客户生态,恒玄科技正从智能音频芯片厂商向低功耗端侧AI平台提供商转型,卡位AI智能硬件赛道,成长潜力突出。 > 瑞芯微:深耕AIoT领域,赋能百业智能化升级。公司作为国内AIoTSoC芯片领域的领军企业,公司自2001年成立以来,始终专注于智能应用处理器SoC及周边配套芯片的研发与创新。凭借在AIoT核心技术、产品组合、场景应用及客户资源等方面的深厚积累,公司构建了覆盖汽车电子、机器视觉、工业控制、教育办公、商业金融、智能家居及消费电子等多元化行业的芯片解决方案平台,为下游客户提供多层次、多算力的AIoT芯片支持。目前,公司已与安克创新、比亚迪、百度、歌尔、科沃斯、SONY、腾讯、网易、小米、中国电信等数千家知名企业建立长期合作关系,在国内外市场树立了卓越的品牌影响力。 > 广和通:公司持续强化物联网垂直领域布局,在端侧AI领域实现重要技术突破。自主研发的FibocomAIStack技术平台整合了机器视觉、语音识别和生成式AI等前沿技术,并成功将轻量化蒸馏模型部署至AI模组,显著提升了边缘设备的智能化水平。公司通过融合AI技术与垂直场景需求,推出一系列创新解决方案。1)AI玩具大模型MagiCore:内置广和通Cat.1模组,集成豆包等AI大模型,并通过火山引擎接入DeepSeek,支持智能早教玩偶的多维交互功能,已与实丰文化合作成立联合实验室深化应用开发。2)多功能AI红外相机:结合AI算法与高精度传感器,适用于户外打猎、森林防火等专业场景,提升环境监测与风险预警能力。3)QuickTasteAI:部署于联迪商用智能终端,解决餐饮行业语言沟通障碍,优化点餐与服务流程。4)AIBuddy:提供实时翻译、语音交互等功能,适配多种智能设备,拓展消费级AI应用边界。同时,公司在机器人领域已构建从平台设计到供应链管理、生产制造的全流程能力,定位超越传统代工模式。通过持续加码AI与机器人研发投入,公司正从单一的智能模组供应商向整体解决方案提供商转型,培育多元业绩增长点。 > 乐鑫科技:公司在端侧AI领域的布局可追溯至2019年,展现出前瞻性的技术规划能力。2020年底推出的ESP32-S3芯片已成为AIoT应用的主力产品线,该芯片集成了端侧AI处理能力,在2023年实现规模化量产。目前,乐鑫正积极推进基于RISC-V架构的下一代AI芯片研发,以应对日益增长的AIoT市场需求。这种"处理+连接"双轮驱动的产品策略,使公司能够持续提升产品性能和价值量,实现量价齐升的良性发展。AIoT生态合作与创新应用:在AI硬件创新方面,乐鑫与火山引擎的合作颇具代表性。2024年双方联合推出的"AI+硬件智跃计划",通过豆包大模型与乐鑫芯片的深度整合,为智能潮玩产品提供了完整的"大脑-肉体-灵魂"解决方案。这种端云协同架构既实现了本地实时交互,又能调用云端智能服务,已成功应用于Bubblepal等多款热销产品。 # 5. 风险提示 技术风险与性能瓶颈:硬件兼容性与模型碎片化、算力与能耗的平衡难题、模型轻量化与精度损失等。 > 商业落地与生态风险:场景适配与ROI不确定性、应用缺失与用户粘性不足、新旧体系替代冲突等。 系统安全风险:边缘节点的安全脆弱性、算法偏见与决策不可解释性、隐私保护与数据合规挑战等。 > 供应链与地缘政治风险:高端芯片国产化瓶颈、技术标准改变、全球化摩擦加剧等。 # 研究团队简介: 陈建森:悉尼大学金融学硕士,新南威尔士大学经济学学士。曾就职于普华永道中天会计师事务所制造业组,2023年加入东北证券,现任东北证券通信组分析师。 # 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格,并在中国证券业协会注册登记为证券分析师。本报告遵循合规、客观、专业、审慎的制作原则,所采用数据、资料的来源合法合规,文字阐述反映了作者的真实观点,报告结论未受任何第三方的授意或影响,特此声明。 投资评级说明 <table><tr><td rowspan="5">股票 投资 评级 说明</td><td>买入</td><td>未来6个月内,股价涨幅超越市场基准15%以上。</td><td rowspan="8">投资评级中所涉及的市场基准: A股市场以沪深300指数为市场基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为市场基准;香港市场以摩根士丹利中国指数为市场基准;美国市场以纳斯达克综合指数或标普500指数为市场基准。</td></tr><tr><td>增持</td><td>未来6个月内,股价涨幅超越市场基准5%至15%之间。</td></tr><tr><td>中性</td><td>未来6个月内,股价涨幅介于市场基准-5%至5%之间。</td></tr><tr><td>减持</td><td>未来6个月内,股价涨幅落后市场基准5%至15%之间。</td></tr><tr><td>卖出</td><td>未来6个月内,股价涨幅落后市场基准15%以上。</td></tr><tr><td rowspan="3">行业 投资 评级 说明</td><td>优于大势</td><td>未来6个月内,行业指数的收益超越市场基准。</td></tr><tr><td>同步大势</td><td>未来6个月内,行业指数的收益与市场基准持平。</td></tr><tr><td>落后大势</td><td>未来6个月内,行业指数的收益落后于市场基准。</td></tr></table> # 重要声明 本报告由东北证券股份有限公司(以下称“本公司”)制作并仅向本公司客户发布,本公司不会因任何机构或个人接收到本报告而视其为本公司的当然客户。 本公司具有中国证监会核准的证券投资咨询业务资格。 本报告中的信息均来源于公开资料,本公司对这些信息的准确性和完整性不作任何保证。报告中的内容和意见仅反映本公司于发布本报告当日的判断,不保证所包含的内容和意见不发生变化。 本报告仅供参考,并不构成对所述证券买卖的出价或征价。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的证券买卖建议。本公司及其雇员不承诺投资者一定获利,不与投资者分享投资收益,在任何情况下,我公司及其雇员对任何人使用本报告及其内容所引发的任何直接或间接损失概不负责。 本公司或其关联机构可能会持有本报告中涉及到的公司所发行的证券头寸并进行交易,并在法律许可的情况下不进行披露;可能为这些公司提供或争取提供投资银行业务、财务顾问等相关服务。 本报告版权归本公司所有。未经本公司书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,须在本公司允许的范围内使用,并注明本报告的发布人和发布日期,提示使用本报告的风险。 若本公司客户(以下称“该客户”)向第三方发送本报告,则由该客户独自为此发送行为负责。提醒通过此途径获得本报告的投资者注意,本公司不对通过此种途径获得本报告所引起的任何损失承担任何责任。 # 东北证券股份有限公司 网址:http://www.nesc.cn 电话:95360,400-600-0686 研究所公众号:dbzqyanjiusuo <table><tr><td>地址</td><td>邮编</td></tr><tr><td>中国吉林省长春市生态大街6666号</td><td>130119</td></tr><tr><td>中国北京市西城区锦什坊街28号恒奥中心D座</td><td>100033</td></tr><tr><td>中国上海市浦东新区杨高南路799号</td><td>200127</td></tr><tr><td>中国深圳市福田区福中三路1006号诺德中心34D</td><td>518038</td></tr><tr><td>中国广东省广州市天河区冼村街道黄埔大道西122号之二星辉中心15楼</td><td>510630</td></tr></table>