> **来源:[研报客](https://pc.yanbaoke.cn)** # OpenClaw 新手入门宝典 总结 ## 核心内容 ### 1. OpenClaw 简介 - **定义**:OpenClaw 是一个 AI 智能体平台(Agent Platform),让 AI 在电脑上运行,并接入日常使用的工具。 - **功能**:提供文件管理、上网搜索、提醒和日程管理、消息发送、语音转换、文档处理、设备管理等功能。 - **限制**:无法操作物理设备、绕过强安全验证、无法进行复杂推理、执行任务可能失败、无 UI 界面。 - **目标**:将 AI 从“只会聊天”转变为“能动手执行任务”的全能助手。 ### 2. OpenClaw 爆火原因 - **技术突破**:突破传统 AI 沙盒限制,实现系统级权限与自主执行。 - **市场需求**:精准满足职场人与开发者的效率需求,如自动处理文件、自动化办公流程。 - **社区驱动**:开源+免费,社区快速产出 3000+ 技能插件,实现病毒式传播。 - **事件催化**:谷歌封号事件引发广泛关注,成为 OpenClaw 破圈的关键。 - **时代背景**:2026 年是 AI Agent 的元年,OpenClaw 成为首个大规模落地的 AI Agent 框架。 ### 3. OpenClaw 与 Manus 对比 | 对比维度 | Manus | OpenClaw | |----------|-------|----------| | 产品性质 | 商业 SaaS 平台(闭源) | 开源项目(MIT 协议) | | 部署方式 | 云端托管,登录即用 | 本地部署(电脑/服务器) | | 运行环境 | 云端沙箱(厂商服务器) | 本地设备或自行部署到云环境 | | 控制权 | 平台完全掌控 | 用户 100% 掌控 | | 数据隐私 | 数据上传云端,依赖厂商安全 | 数据本地存储,隐私自主可控 | | 模型选择 | 内置专用模型,不可更换 | 可自由切换 GPT-4、Claude、DeepSeek 等 | | 权限边界 | 沙箱隔离,无法逃逸 | 可获得宿主机完整权限(风险更高) | | 上手门槛 | 极低(零配置、开箱即用) | 中高(需部署、配置模型、写 Skill) | | 成本 | 订阅付费(月费/积分) | 免费开源,仅承担模型 API 费用 | | 生态 | 官方技能库,审核严格 | 社区驱动,3000+ 开源 Skill 自由使用 | **总结**:Manus 是“五星级酒店式 AI 服务”,OpenClaw 是“DIY 厨房式 AI 工具”。 ### 4. 技术原理 - **架构**:采用“网关调度+LLM决策+技能执行+分层记忆”的闭环架构。 - **三层解耦设计**: - **网关层**(Gateway):负责消息标准化、会话路由、技能调度、安全认证与状态维护。 - **模型层**:支持 GPT-4、Claude 等云端模型与 Llama、Mistral 等本地模型的混合部署。 - **技能层**:技能作为 AI 的“手脚”,通过标准化协议封装 Shell 执行、文件读写、浏览器驱动等能力。 - **核心运行逻辑**:Agent 循环(思考-行动-反馈-记忆)。 - **保障机制**: - **分层记忆体系**:包括系统人格、工具注册表、用户偏好、实时会话记忆。 - **并发安全机制**:通过基于文件的分布式锁、指数退避重试、过期锁自动回收、看门狗线程等实现。 - **安全策略**:九层策略过滤,限制敏感操作;支持本地模型优先+云端模型降级,保障隐私与安全。 ## 安装环境准备 ### 1. 官方支持的操作系统 | 系统类型 | 最低版本 / 要求 | 推荐选择 | 关键说明 | |----------|------------------|-----------|-----------| | Linux | Ubuntu 20.04+ LTS、Debian 11+ | Ubuntu 22.04 LTS | 生产环境首选,原生支持所有功能 | | macOS | macOS 12+ (Monterey) | macOS 14+ (Sonoma) | Intel/Apple Silicon 均原生兼容 | | Windows | Windows 10 21H2+/11 | WSL2 (Ubuntu 22.04) | 官方推荐,避免编译与兼容性问题 | | 云容器 | 九章智算云云容器实例 | - | 提供公网地址与端口,可 24 小时运行 | ### 2. 核心软件依赖(必选) | 依赖项 | 最低版本 | 安装说明 | 作用 | |--------|----------|----------|------| | Node.js | 22.x | 官方源安装,避免系统默认低版本 | 框架核心运行时 | | Git | 2.30+ | 系统包管理器或官网安装 | 拉取源码与版本管理 | | 模型后端 | - | 二选一:云端 API 或本地服务(如 Ollama ≥0.15.4 / LM Studio) | 提供 LLM 推理能力 | | Windows 原生额外 | - | 安装 Visual C++ Build Tools(勾选“C++ 桌面开发”) | 编译 node-llama-cpp 等原生模块 | ### 3. 网络与端口要求 - **网络连通性**:云端模型需稳定访问海外 API(国内用户需配置代理);本地模型可完全离线。 - **端口放行**:主网关端口为 18789(WebSocket,必须开放);管理/调试端口根据插件需求开放;远程访问需配合反向代理(如 Nginx)并做好认证。 ### 4. 安全与权限要求 - **权限基础**:本地部署需管理员/root 权限;容器化需遵循“最小权限”原则。 - **安全策略**:启用官方九层权限过滤,限制敏感操作;确保密钥不暴露在可访问文件系统中;使用最强模型保障安全。 ### 5. 快速部署建议 - **新手优先**:使用官方一键脚本自动检测并满足所有环境要求。 - **命令示例**: ```bash Linux/macOS: curl -fsL https://openclaw.ai/install.sh | bash Windows (PowerShell): iwr -useb https://openclaw.ai/install.ps1 | iex ``` - **推荐方式**:使用 WSL2,避免原生环境的编译与兼容性问题。 - **本地模型**:推荐搭配 Ollama 部署,模型如 ministral-3:8b 或 glm-4.7-flash。 ### 6. 免部署使用方案 - **推荐产品**:第三方供应方提供的在线产品,首月 45 元即可体验,地址:https://www.alayanew.com/product/openClaw?utm_source=official04 ## 安装部署 ### 1. 环境检查:Node.js 是什么? - **简介**:Node.js 是一个让 JavaScript 能在电脑本地运行的环境。 - **检查版本**: ```bash node --version ``` - **期望版本**:v22.x.x ### 2. 安装命令 - **命令**: ```bash npm install -g openclaw@latest ``` - **验证安装**: ```bash openclaw --version ``` - **期望输出**:类似 `2026.2.22-2`。 ### 3. 运行向导:openclaw onboard - **参数说明**: - `onboard`:运行初始化向导 - `--install-daemon`:同时安装后台服务(推荐) - **步骤**: 1. **风险提示**:选择 Yes 继续。 2. **选择配置模式**:推荐选择 QuickStart,快速启动。 3. **选择模型提供商**:推荐 MiniMax2.5,需提前获取 API Key。 4. **选择鉴权方式**:推荐 API 鉴权。 5. **配置 Skills**:建议不配置,避免因网络问题影响使用。 6. **配置 Hooks**:建议最小开启,用于自定义流程。 7. **选择 Hatch 方式**:推荐通过 Web UI 访问,配置允许公网访问。 - **配置文件示例**:`/root/.openclaw/openclaw.json`,包含模型、工具、钩子等配置。 ### 4. 配置说明 - **模型配置**:支持云端与本地模型,通过 `models.json` 配置。 - **技能配置**:通过 Skills 文件夹配置,推荐不配置。 - **钩子配置**:通过创建 hooks 文件夹,按钩子名称创建脚本文件。 - **Web UI 访问**:通过 `http://127.0.0.1:18789` 访问,支持公网 IP 映射。 ## 术语与架构 ### 1. 核心架构术语 | 术语 | 中文释义 | 核心作用 | 关键细节 | |------|----------|----------|----------| | Gateway | 网关 | 中央协调器与进程管家 | 管理所有 Channels、路由消息、控制 Agent 生命周期 | | Agent | 智能体 | 任务执行的核心实例 | 由工作区文件定义能力与人格 | | Channel | 渠道 | 用户交互入口 | 对接 Telegram、Discord、飞书等 23+ 平台 | | Node | 节点 | 跨设备执行单元 | 用于 iOS/Android 等终端,提供 Canvas、摄像头等能力 | ### 2. 智能体与记忆术语 | 术语 | 中文释义 | 核心作用 | 关键细节 | |------|----------|----------|----------| | Workspace | 工作区 | Agent 配置目录 | 存放 Identity、Soul、Skills 等文件 | | Identity | 身份 | Agent 核心标识 | 定义角色、职责与权限 | | Soul | 灵魂 | 人格与风格定义 | 细化沟通语气、专业背景 | | Memory | 记忆系统 | 持久化与上下文管理 | 分为系统人格、工具注册表、用户长期偏好、实时会话记忆 | | Session Memory | 会话记忆 | 对话上下文 | 记录当前会话的交互内容 | | Semantic Memory | 语义记忆 | 知识与概念 | 存储长期事实、偏好 | | Procedural Memory | 程序记忆 | 技能与模式 | 记录常用任务的执行流程 | | Working Memory | 工作记忆 | 当前任务焦点 | 临时存储任务中间状态 | | Compaction | 会话压缩 | 记忆优化策略 | 压缩会话记忆,保留关键信息 | ### 3. 技能与工具术语 | 术语 | 中文释义 | 核心作用 | 关键细节 | |------|----------|----------|----------| | Skill | 技能 | 可复用的能力包 | 以文件夹为单元,核心是 SKILL.md(YAML 元数据+Markdown 指令) | | Tool | 工具 | 原子操作能力 | 如文件操作、终端执行、浏览器驱动(Playwright)、网页搜索 | | SKILL.md | 技能定义文件 | 技能的“说明书” | 元数据声明依赖,正文用自然语言教 Agent 如何执行 | | Progressive Disclosure | 渐进式信息披露 | 技能加载策略 | 启动时仅加载元数据,触发后加载正文,执行时按需读取资源 | ### 4. 交互与运行术语 | 术语 | 中文释义 | 核心作用 | 关键细节 | |------|----------|----------|----------| | Agent Loop | 智能体循环 | 核心执行流程 | 接收消息→上下文组装→模型推理→工具执行→流式回复→记忆持久化 | | Bootstrap | 引导 | 系统提示构建 | 在模型推理前,组装 Identity、Soul、Skills 等上下文 | | Hook | 钩子 | 扩展与拦截点 | 通过钩子名称创建脚本文件,实现自定义流程 | | Hatch | 孵化 | 启动入口 | 通过终端或 Web UI 访问 | ### 5. 安全与扩展术语 | 术语 | 中文释义 | 核心作用 | 关键细节 | |------|----------|----------|----------| | Sandbox | 沙箱 | 安全执行环境 | 隔离工具/脚本的执行权限,防止恶意操作 | | RPC | 远程过程调用 | 跨进程通信 | Gateway 与 Agent 的通信方式,支持 agent/agent.wait 等指令 | | Cron | 定时任务 | 自动化调度 | 支持按时间规则触发任务(如“每天 8 点整理邮件”) | ## 总结 OpenClaw 通过本地优先架构与标准化技能系统,成为 2026 年 AI Agent 领域的技术标杆。其核心技术包括系统级权限突破、24 小时自主执行、本地优先+记忆持久化、多端协同等。通过与飞书、微信等聊天工具的接入,实现了跨平台任务执行。安装与部署过程灵活,支持一键部署与本地模型。技能与钩子机制为用户提供了高度的定制化能力。安全架构采用九层策略过滤,保障用户数据安全。OpenClaw 是一个强大但有局限的 AI 执行框架,适合开发者与极客,而非非技术用户。