> **来源:[研报客](https://pc.yanbaoke.cn)** 计算机组 分析师:刘高畅 (执业S1130525120005) liugaochang@gjzq.com.cn # GPT-5.4:执行型AI加速落地,OpenClaw绝佳搭档 # 行业观点: # GPT-5.4 发布,迈向“可执行 AI”的重要升级 GPT-5.4 的发布标志着大模型能力从“对话生成”向“任务执行”的重要跃迁。本次升级在推理能力、编程能力以及智能体工作流方面进行了系统性强化,并首次在模型层面大规模整合Computer Use、工具调用与联网搜索能力,使AI可以在真实软件环境中完成复杂任务。具体来看:1)原生Computer Use能力使模型能够通过视觉理解屏幕并执行鼠标点击、键盘输入等操作,在OSWorld等桌面操作基准测试中成功率接近人类水平,意味着AI具备在真实系统中执行任务的能力;2)Tool Search机制大幅优化工具调用流程,通过按需检索工具定义的方式减少上下文Token消耗,从而提升多工具Agent系统的效率并降低成本;3)联网搜索能力与推理能力进一步增强,使模型能够通过多轮搜索整合全网信息解决复杂问题;4)知识型工作能力显著提升,在电子表格、文档、演示文稿等专业办公任务中的表现接近甚至超过部分行业专业人士水平。整体来看,GPT-5.4验证了AI发展的两大趋势:一是模型迭代节奏持续加快,二是Computer Use与工具调用能力正在打通AI从“对话”走向“执行”的关键环节,Agent商业化落地路径日益清晰。 # OpenClaw + GPT-5.4: Agent 时代的绝佳组合 随着AI行业进入Agent时代,市场关注点逐渐从单一模型能力转向“模型 + Agent框架”的系统能力。在这一背景下,开源Agent框架OpenClaw与GPT-5.4的组合被开发者社区和媒体认为是当前极具潜力的技术路径之一。OpenClaw作为一个完全开源且可本地运行的AI Agent框架,核心目标是让AI能够直接操作电脑完成真实工作任务。GPT-5.4在多个关键能力上的升级,使其与OpenClaw形成高度互补:1)原生Computer Use能力使模型可以直接操作桌面软件,减少传统Agent框架需要复杂适配和自动化脚本的技术成本;2)100万Token的超长上下文为长期运行的Agent提供了更大的“工作记忆”,能够在复杂任务链和长时间任务执行过程中保持稳定的上下文理解;3)Tool Search机制显著降低多工具调用带来的Token成本,使OpenClaw在接入大量Skills与工具时仍能保持较高效率;4)模型推理与专业任务能力的提升,使Agent能够胜任更复杂、更高价值的知识工作场景。整体来看,OpenClaw与GPT-5.4的结合有望推动AI Agent从实验性工具逐步走向真实生产力系统,加速AI在办公自动化、软件开发和复杂知识工作的落地应用。 # 投资建议: 国内算力:寒武纪、东阳光、海光信息、协创数据、豫能控股、华丰科技、亿田智能、星环科技、网宿科技、宏景科技、首都在线、神州数码、百度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。 海外算力/存储:中际旭创、新易盛、兆易创新、大普微、天孚通信、源杰科技、胜宏科技、景旺电子、英维克等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。 CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广合科技。 AI应用:1)超级入口:腾讯控股、Minimax、智谱、阿里巴巴、科大讯飞。2)星环科技、德才股份、美年健康、中控技术、卓易信息、昆仑万维等AIINFRA&高增长&高壁垒。其他:空天时代、具身智能等。 # 风险提示 行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期性波动的风险。 # 一、GPT-5.4发布,迈向“可执行AI”的重要升级 2026年3月5日,OpenAI发布GPT-5.4,定位为面向复杂工作任务的旗舰模型。GPT-5.4将OpenAI近期在推理、编程及智能体工作流领域的顶尖性能集于一身。整合了GPT-5.3-Codex行业领先的编程能力,同时优化了模型在各类工具、软件环境以及专业任务(电子表格、ppt和文档等)中的表现,支持高达100万Token的上下文,能够准确高效地完成复杂的实际工作。 # 1.1 原生 Computer Use: AI 具备真实操作电脑能力 GPT-5.4最重要的升级之一是原生“Computer Use”能力。模型可以通过视觉理解屏幕截图,识别界面中的按钮、文本框和菜单,并执行鼠标点击、键盘输入等操作,从而在真实操作系统环境中完成任务。 在OSWorld桌面操作基准测试中,GPT-5.4的成功率达到约 $75\%$ ,已经接近甚至超过人类平均水平。这意味着Agent在真实软件环境中的执行能力具备可用性。 图表1:OSWorld 桌面操作基准测试 一次工具产出(Tool Yield)是指助手等待工具响应的过程。例如,如果模型并行调用了3个工具,随后又并行调用了另外3个工具,则产出数计为2次。相比于工具调用数,工具产出数能更好地反映并行化的优势,因此是衡量延迟更准确的指标。 来源:OpenAI,国金证券研究所 # 1.2工具搜索:大规模工具调用能力 GPT-5.4 在 API 层面引入工具搜索机制。在此之前,当模型调用工具时,所有的工具定义都必须预先包含在提示词中。对于拥有大量工具的系统,这会导致每次请求都额外增加数千甚至数万个 Token,不仅推高了成本、减慢了响应速度,还让上下文中充斥着模型可能永远用不到的冗余信息。 通过工具搜索,GPT-5.4不再需要预加载完整定义,而是接收一份精简的可选工具列表及工具搜索能力。当模型需要调用特定工具时,它会即时查找该工具的定义,并将其添加到当前的对话上下文。这种方法大幅减少了重度工具调用工作流程所需的Token数量,并有效保留了缓存,使请求变得更快、成本更低。这一能力对于构建复杂AI Agent系统具有关键意义,因为真实应用往往需要调用大量工具。 # 1.3 更强的联网搜索能力 GPT-5.4在智能体联网搜索方面表现更佳。在实际应用中,这意味着GPT-5.4 Thinking能够更强有力地解答那些需要整合全网多方信息的复杂问题。它能以更强的持久性进行多轮搜索, 从而锁定最相关的信源——尤其是在处理“大海捞针”式的问题时,它能高效提炼核心信息,并给出逻辑清晰、论证严密的回答。 图表2:BrowseComp基准测试得分(衡量智能体通过持续浏览网页获取难寻信息的能力) 来源:OpenAI,国金证券研究所 # 1.4知识型工作能力大幅提升 在GDPval测试中(涵盖44种职业的知识工作任务),GPT-5.4在 $83\%$ 的案例中或达到超越行业专业人士水准,比GPT-5.2的 $71\%$ 有显着的跃升。 OpenAI还重点提升了GPT-5.4创建和编辑表格、演示文稿及文档的能力。针对初级投行分析师水平的电子表格建模任务得分从 $68.4\%$ 提升至 $87.5\%$ 图表3:GPT-5.4处理电子表格、演示文稿及文档的能力大幅提升 来源:OpenAI,国金证券研究所 # 1.5 可控性提升 GPT-5.4 Thinking 现在也会在处理更长、更复杂的查询时,通过“前言”来简述其工作方案。此外,还可以在模型生成过程中实时添加指令或调整其方向。让用户能更轻松地引导模型达成预期的结果,而无需推倒重来,或通过多轮额外对话进行补救。 总结:从聊天模型到执行型AI、我们认为GPT-5.4的发布验证了两个核心趋势:一是模型迭代节奏显著加快(GPT-5系列自2025年8月以来已迭代至5.4版本),前沿模型竞争从"智商比拼"转向"场景落地效率";二是Computer Use $^+$ 工具调用的组合正在打通AI从"对话"到"执行"的最后一公里,Agent商业化路径日趋清晰。 # 二、OpenClaw+GPT 5.4,Agent 绝佳组合 随着AI行业进入Agent时代,市场关注点开始从单纯的大模型能力转向“模型 + Agent框架”的系统能力。开源AI Agent框架OpenClaw与GPT-5.4的组合就是极具具潜力的技术路线之一。 由独立开发者 Peter Steinberger 在 2025 年 11 月推出的 OpenClaw,定位为完全开源且本地运行的 AI Agent 框架。它具备真正的行动力,电脑在它眼中变作了可以肆意发挥的沙盒,执行终端命令、读写文件、收发邮件乃至代替主人管理日程,一切均在自然的对话间完成。 据新浪财经报道,OpenClaw 就仅用两月击败 Linux,登顶 GitHub 星标榜,正式加冕史上最受欢迎开源项目。 图表4:OpenClaw 的 GitHub 星标增长速度 好好消化一下。一个热爱龙虾的奥地利人和一支甲壳类动物爱好者大军刚刚超过了支撑互联网一半的库的星标。 我们今天发布了90多个变更。他们发布了一场会议。 来源:X,国金证券研究所 GPT-5.4与Computer Use能力与OpenClaw高度契合。IT之家报道认为,GPT-5.4可能是2026年目前为止,最适合跑OpenClaw的模型。 模型的推理能力、工具调用准确度、长程任务的上下文保持能力,直接决定了 OpenClaw 的实际工作能力。而 GPT-5.4 恰恰在 OpenClaw 最需要的每一个维度上,都踩中了甜蜜点。 # 原生电脑操控: OpenClaw的核心价值就是让AI操作你的电脑。GPT-5.4原生具备这一能力,这意味着接入GPT-5.4的OpenClaw,不再需要通过复杂的适配和Hack来实现桌面自动化,从底层就是为这个场景而生。 # 100万Token上下文: - OpenClaw 是一个持续运行的 Agent,需要维持长对话、记住复杂指令链、处理大量文件内容。以前用其他模型,跑着跑着就忘了前面的任务。100 万 Token 的上下文窗口,意味着 OpenClaw 终于有了足够大的工作台来铺开所有材料。 # Tool Search: OpenClaw 的强大之处在于它可以接入数十种 Skills 和工具。但工具越多,每次调用消耗的 Token 就越多,成本飙升。GPT-5.4 的 Tool Search 机制天然解决了这个问题——不用把所有工具定义都塞进上下文,按需取用,Token 消耗直降 $47\%$ 。对于长期运行的 OpenClaw 来说,可以大幅减少 API 调用费用 # 推理能力跃升: 低端模型运行 OpenClaw,遇到稍微复杂的任务就卡壳。GPT-5.4 在专业工作任务中超过 $83\%$ 的人类专家表现,配合其在数学、编程、文档处理等领域的全面提升,意味着 OpenClaw 可以胜任更复杂、更高价值的工作场景。 OpenClaw之父Peter也评价GPT-5.4在编程能力提升不小外,在其他能力方面更加统一、更加智能: 图表5:OpenClaw之父Peter对GPT-5.4的评论 来源:新智元,国金证券研究所 OpenClaw 的官方文档已经提供了 GPT-5.4 的接入配置方案,OpenAI 的 Responses API 也已全面支持。 我们认为,在AI Agent生态中GPT-5.4 + OpenClaw是当前极具潜力的技术组合之一,有望推动AI从对话助手向自动执行复杂任务的智能系统演进。 # 风险提示 行业竞争加剧的风险:在信创等政策持续加码支持计算机行业发展的背景下,众多新兴玩家参与到市场竞争之中,若市场竞争进一步加剧,竞争优势偏弱的企业或面临出清,某些中低端品类的毛利率或受到一定程度影响。 技术研发进度不及预期的风险:计算机行业技术开发需投入大量资源,如果相关厂商新品研发进程不及预期,表观层面将呈现出投入产出在较长时期的滞后特征。 特定行业下游资本开支周期性波动的风险:部分计算机公司系顺周期行业,下游资本开支波动与行业周期性相关性较强,或在个别年份对于上游软件厂商的营收表现产生扰动。李可夫2026-02-08 01:31 李可夫2026。 # 行业投资评级的说明: 买入:预期未来3一6个月内该行业上涨幅度超过大盘在 $15\%$ 以上; 增持:预期未来3一6个月内该行业上涨幅度超过大盘在 $5\% -15\%$ 中性:预期未来3—6个月内该行业变动幅度相对大盘在 $-5\% - 5\%$ 减持:预期未来3一6个月内该行业下跌幅度超过大盘在 $5\%$ 以上。 # 特别声明: 国金证券股份有限公司经中国证券监督管理委员会批准,已具备证券投资咨询业务资格。 形式的复制、转发、转载、引用、修改、仿制、刊发,或以任何侵犯本公司版权的其他方式使用。经过书面授权的引用、刊发,需注明出处为“国金证券股份有限公司”,且不得对本报告进行任何有悖原意的删节和修改。 本报告的产生基于国金证券及其研究人员认为可信的公开资料或实地调研资料,但国金证券及其研究人员对这些信息的准确性和完整性不作任何保证。本报告反映撰写研究人员的不同设想、见解及分析方法,故本报告所载观点可能与其他类似研究报告的观点及市场实际情况不一致,国金证券不对使用本报告所包含的材料产生的任何直接或间接损失或与此有关的其他任何损失承担任何责任。且本报告中的资料、意见、预测均反映报告初次公开发布时的判断,在不作事先通知的情况下,可能会随时调整,亦可因使用不同假设和标准、采用不同观点和分析方法而与国金证券其它业务部门、单位或附属机构在制作类似的其他材料时所给出的意见不同或者相反。 本报告仅为参考之用,在任何地区均不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告提及的任何证券或金融工具均可能含有重大的风险,可能不易变卖以及不适合所有投资者。本报告所提及的证券或金融工具的价格、价值及收益可能会受汇率影响而波动。过往的业绩并不能代表未来的表现。 客户应当考虑到国金证券存在可能影响本报告客观性的利益冲突,而不应视本报告为作出投资决策的唯一因素。证券研究报告是用于服务具备专业知识的投资者和投资顾问的专业产品,使用时必须经专业人士进行解读。国金证券建议获取报告人员应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。报告本身、报告中的信息或所表达意见也不构成投资、法律、会计或税务的最终操作建议,国金证券不就报告中的内容对最终操作建议做出任何担保,在任何时候均不构成对任何人的个人推荐。 在法律允许的情况下,国金证券的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能为这些公司正在提供或争取提供多种金融服务。 本报告并非意图发送、发布给在当地法律或监管规则下不允许向其发送、发布该研究报告的人员。国金证券并不因收件人收到本报告而视其为国金证券的客户。本报告对于收件人而言属高度机密,只有符合条件的收件人才能使用。根据《证券期货投资者适当性管理办法》,本报告仅供国金证券股份有限公司客户中风险评级高于C3级(含C3级)的投资者使用;本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,不应被视为对特定客户关于特定证券或金融工具的建议或策略。对于本报告中提及的任何证券或金融工具,本报告的收件人须保持自身的独立判断。使用国金证券研究报告进行投资,遭受任何损失,国金证券不承担相关法律责任。 若国金证券以外的任何机构或个人发送本报告,则由该机构或个人为此发送行为承担全部责任。本报告不构成国金证券向发送本报告机构或个人的收件人提供投资建议,国金证券不为此承担任何责任。 此报告仅限于中国境内使用。国金证券版权所有,保留一切权利。 # 上海 电话:021-80234211 邮箱:researchsh@gjzq.com.cn 邮编:201204 地址:上海浦东新区芳甸路1088号紫竹国际大厦5楼 # 北京 电话:010-85950438 邮箱:researchbj@gjzq.com.cn 邮编:100005 地址:北京市东城区建内大街26号新闻大厦8层南侧 # 深圳 电话:0755-86695353 邮箱:researchsz@gjzq.com.cn 邮编:518000 地址:深圳市福田区金田路2028号皇岗商务中心18楼1806 【小程序】国金证券研究服务 【公众号】国金证券研究