> **来源:[研报客](https://pc.yanbaoke.cn)** # 大模型上下文工程 (Context Engineering) 指南总结 ## 核心内容 《大模型上下文工程指南》是一份旨在帮助开发者、架构师和产品经理构建高级AI应用的文档。它从“提示工程”(Prompt Engineering)的局限出发,提出了一种全新的范式——“上下文工程”,强调构建、管理和经营一个动态、结构化的上下文系统,以实现更智能、更可靠的AI应用。 ## 主要观点 - **上下文的重新定义**:上下文不再仅仅是“Token窗口”,而是涵盖了文本、环境、用户、系统和组织五个维度的系统状态。 - **范式跃迁**:从被动的“提示工程”转向主动的“上下文工程”,构建一个能够动态感知、获取、处理和管理上下文的系统。 - **技术演进**:上下文技术经历了三次关键飞跃,从静态输入窗口,到长上下文窗口,再到外部记忆和RAG,最终发展为智能体与协议化上下文。 ## 关键信息 ### 1. 上下文的五个维度 | 上下文类别 | 核心定义 | 关键要素 | 作用与价值 | |------------|----------|----------|------------| | 文本上下文 | 模型直接处理的文本信息流 | Prompt、系统指令、历史对话、Few-shot示例、RAG检索结果 | 构成模型推理的直接输入和工作记忆,是所有上下文的基础 | | 环境上下文 | AI智能体所处的动态环境状态 | 任务状态、会话Session、时间/地点、工具/API状态 | 赋予模型“此时此地”的感知能力 | | 用户上下文 | 关于交互对象的个性化信息 | 身份、偏好、角色、权限、历史行为、情绪状态 | 实现从“通用助手”到“私人助理”的跃迁 | | 系统上下文 | AI系统自身的技术与能力配置 | 模型版本、可用工具、协议规范、运行参数 | 让模型了解“自己是谁、能做什么”,是实现自主规划和可靠执行的前提 | | 组织上下文 | 特定领域或机构的专有知识与规则 | 内部知识库、业务流程、合规策略、行业术语、组织架构 | 使模型能够融入企业环境,成为理解并遵守特定规则的“领域专家” | ### 2. 上下文技术的三次飞跃 #### 2.1 静态输入窗口时代(2017-2022) - **核心技术**:Transformer架构,自注意力机制。 - **问题**:上下文窗口有限,难以处理复杂任务。 - **解决方案**:Prompt Engineering,通过优化Prompt结构提升模型性能。 #### 2.2 长上下文窗口竞赛(2022-2024) - **核心技术**:FlashAttention、RoPE、ALiBi、稀疏注意力。 - **成果**:上下文窗口从几千扩展到百万级别。 - **问题**:信息过多导致注意力稀释,上下文腐烂。 - **解决方案**:引入外部记忆和RAG技术,实现信息的结构化和持久化。 #### 2.3 外部记忆与RAG的兴起(2023-2025) - **核心思想**:解耦“计算”与“存储”,使用外部知识库进行推理。 - **技术实现**:RAG流程包括检索、增强、生成。 - **工具**:MemGPT提供“内存管理系统”,实现上下文的动态管理。 #### 2.4 智能体与协议化上下文(2025-2026) - **核心技术**:MCP(模型上下文协议)、A2A(智能体间协议)。 - **MCP**:定义标准化的客户端-服务器架构,解耦智能体与能力。 - **A2A**:标准化多智能体协作流程,实现去中心化的上下文网络。 - **愿景**:构建一个智能体社会,实现高效、安全、可扩展的协作生态。 ### 3. Prompt 的演进 - **Prompt的本质**:一次性、静态的人机指令,是上下文工程的底层入口。 - **高级Prompt技术**:如思维链(CoT)和ReAct(推理+行动),提升模型推理能力。 - **Prompt的局限**:脆弱性、难以管理、与世隔绝。 - **演进方向**:从Prompt Engineering到Context Engineering,构建动态的上下文系统。 ### 4. Skills:可复用、可组合的能力单元 - **Skill的定义**:包含功能逻辑、接口Schema、元数据的标准化能力单元。 - **Skill的作用**:连接LLM的推理能力与外部世界的功能,实现任务分解和动态组合。 - **Skill的生命周期**:定义、发布、发现、调用、监控与演进。 - **标准化演进**:从自定义JSON到MCP协议,实现跨平台、跨模型的能力调用。 ### 5. MCP:模型上下文协议 - **MCP的目标**:标准化单智能体的能力接入,实现解耦。 - **MCP架构**:客户端与服务器分离,通过标准化接口调用能力。 - **MCP原语**:工具(Tools)、资源(Resources)、提示词(Prompts)。 - **MCP工作流示例**:以订票查询为例,展示MCP在实际应用中的流程。 ### 6. 上下文工程六大支柱 - **结构化 (Structuring)**:使用XML/JSON、Markdown、Pydantic等结构化方式管理信息。 - **检索 (Retrieval)**:使用向量数据库、混合搜索、重排、查询转换等技术构建智能检索系统。 - **压缩 (Compression)**:通过抽取式与抽象式压缩,提升信息密度与模型效率。 - **编排 (Orchestration)**:利用上下文路由器和代理式编排实现动态任务决策。 - **评估 (Evaluation)**:使用RAGAS等工具实现自动化评估,提升开发效率。 - **安全 (Security)**:通过输入验证、结构化Prompt、输出监控等手段,确保上下文系统的安全性。 ## 未来展望 - **从“无限”上下文到“世界模型”**:上下文将成为一种“流”,模型将具备动态感知和世界理解能力。 - **多模态融合**:从文本RAG发展到多模态RAG(MM-RAG),支持图像、音频等非文本信息。 - **智能体的社会化与经济学**:A2A协议将智能体纳入一个协作网络,上下文工程师将承担协议设计和经济系统分析的新角色。 - **新时代的上下文工程师**:需要掌握结构化、检索、压缩、编排、评估和安全六大支柱,构建可演进的上下文系统。 ## 工具与框架 - **数据与存储层**:向量数据库、知识图谱等。 - **编排与代理层**:LangGraph、MCP、A2A等。 - **评估与观测层**:RAGAS、监控工具等。 - **操作与部署层**:标准化部署流程、跨平台支持等。 ## 结语 《大模型上下文工程指南》为AI应用的开发提供了系统化的框架,强调构建一个能够持续提供高质量上下文的智能系统。未来,上下文将成为AI系统的核心资源,而上下文工程师将扮演至关重要的角色,推动AI从“调教模型”迈向“经营上下文系统”的新时代。