> **来源:[研报客](https://pc.yanbaoke.cn)** # 英伟达技术与生态发展总结 ## 核心内容 英伟达在本次演讲中,围绕其三大平台(CUDA-X、系统平台、AI工厂平台)展开,强调其作为平台公司的核心价值。公司致力于通过软件定义与硬件协同设计,推动加速计算的发展,同时构建一个覆盖AI全生命周期的生态系统。演讲中还重点介绍了其在AI推理、智能体系统、物理AI和机器人技术等领域的最新进展。 ## 主要观点 - **CUDA-X平台**:CUDA 已成为人工智能计算的核心,其底层架构(如SIMT、Tiles)和庞大的开发者生态为AI发展提供了强大支持。CUDA 从25年前的GeForce起步,如今已覆盖全球几乎所有行业。 - **AI工厂平台**:英伟达将AI视为一种新的“大宗商品”,并提出“AI工厂”的概念,通过高吞吐量和高Token速度来提升计算效率与商业价值。公司通过极致协同设计,使Token生成速度提升数十倍。 - **智能体系统(Agentic Systems)**:英伟达推出了OpenClaw,作为首个开源智能体操作系统,其影响力不亚于Linux、HTML、Kubernetes等技术。公司强调,未来所有软件公司都将向“智能体即服务(GaaS)”转型。 - **物理AI与机器人技术**:英伟达在物理AI和机器人领域同样投入巨大,其技术不仅用于自动驾驶、工业机器人,还用于AI-RAN(AI无线接入网)等新兴应用场景。公司正与多家全球领先的汽车、工业、电信企业展开合作。 ## 关键信息 ### 技术平台 - **CUDA-X库**:包含cuDF(结构化数据)和cuVS(非结构化数据),支持AI全生命周期。 - **NVLink 72与NVFP4**:NVLink 72是当前最先进的互连技术,NVFP4是全新的张量核心架构,显著提升推理和训练性能。 - **Vera CPU与Groq合作**:Vera CPU专为AI推理设计,具备高能效与高性能。Groq的确定性数据流处理器与英伟达的NVLink技术结合,实现高吞吐与低延迟的平衡。 ### 生态合作 - **与IBM、Dell、Google Cloud、Snapchat等合作**:加速AI模型和数据处理流程,提升整体计算效率。 - **与OpenAI、Anthropic、Meta等AI实验室合作**:共同推动AI技术发展,覆盖训练、推理、模型优化等多个环节。 - **与电信公司(如T-Mobile)合作**:推出AI-RAN平台,将AI融入基站,提升通信效率与智能化水平。 ### 未来展望 - **2025年为“推理之年”**:英伟达将重点放在推理能力上,提升每瓦Token生成量,推动AI工厂的广泛应用。 - **平台模式**:英伟达强调“纵向整合,横向开放”的平台策略,通过深度集成与开放合作,推动AI技术落地。 - **AI基础设施**:英伟达正在构建全球最大的AI工厂,并通过Omniverse DSX平台进行虚拟设计和协同优化,提升系统级性能与能效。 - **全球部署**:公司支持全球各地的部署需求,包括本地、云端、边缘和太空环境,确保AI的广泛可达性。 ## 战略布局 - **产品路线图**:包括Blackwell、Vera Rubin、Feynman等下一代架构,将推动算力、存储、网络、安全等多方面的技术突破。 - **供应链与产能**:英伟达已建立强大的供应链体系,能够支持大规模AI基础设施部署,包括数千套系统和数吉瓦级的算力。 - **安全与隐私**:公司强调AI在企业环境中的安全需求,推出NemoClaw等企业级安全方案,确保数据与模型的隐私保护。 ## 结论 英伟达正引领AI平台化、工厂化、智能体化的新时代。通过CUDA-X、AI工厂、智能体系统、物理AI等技术,公司构建了覆盖AI全生命周期的生态系统,并推动行业向更高效率、更低成本、更广泛应用场景发展。未来,英伟达将继续深化技术布局,拓展全球合作,助力AI技术全面落地。