> **来源:[研报客](https://pc.yanbaoke.cn)** # AIGC智能体 随着计算能力的提升和大数据的出现,人工智能有了显著的发展,深度学习和机器学习技术的突破使人工智能在视觉识别、语言处理等领域取得惊人的成就,随之兴起的智能体(Agent)标志着人工智能从单纯的任务执行者转变为能够代表或协助人类做出决策的智能实体,它们在理解和预测人类意图、提高决策质量等方面发挥着越来越重要的作用。 # AIGC智能体 智能体是人工智能领域中的一个重要概念,它指的是一个能自主活动的软件或者硬件实体。任何独立的能够思考并可以与环境交互的实体都可以抽象为智能体。LLM在人工智能应用领域的重大突破,给智能体带来了新的发展机会。像ChatGPT这样的基于Transformer架构的LLM,成为为智能体装备的拥有广泛任务能力的“大脑”,从推理、规划和决策到行动都使智能体展现出前所未有的能力。基于LLM的智能体将广泛深刻地影响人们生活工作的方式,由于可以更好地理解和应对复杂多变的现实世界场景,具备更强的智能和自适应能力。因此,智能体被认为是通往AGI的必经之路。 # 目录 / CONTENTS PART 01 # 什么是智能体 # 什么是智能体 智能体通过传感器感知环境并通过执行器作用于该环境的事物。我们从检查智能体、环境以及它们之间的耦合,观察到某些智能体比其他智能体表现得更好,自然引出了理性智能体的概念,即行为尽可能好。智能体的行为取决 于环境的性质,环境可以是一切,甚至是整个宇宙。实际上,设计智能体时关心的只是宇宙中影响智能体感知以及受智能体动作影响的某一部分的状态。 图4-1 智能体通过传感器和执行器与环境交互 # 什么是智能体 人工智能通常通过结果来评估智能体的行为。当智能体进入环境时,它会根据接受的感知产生一个动作序列,这会导致环境经历一系列的状态。如果序列是理想的,则智能体表现良好,这个概念由性能度量描述,评估任何给定环境状态的序列。 # 4.1.1 智能体的定义 一个人类智能体以眼睛、耳朵和其他器官作为传感器,以手、腿、声道等作为执行器。而机器人智能体可能以摄像头和红外测距仪作为传感器,各种电动机作为执行器。软件智能体接收文件内容、网络数据包和人工输入(键盘/鼠标/触摸屏/语音)作为传感输入,并通过写入文件、发送网络数据包、显示信息或生成声音对环境进行操作。 # 4.1.1 智能体的定义 术语 “感知” 用来表示智能体传感器知觉的内容。一个智能体在任何给定时刻的动作选择, 可能取决于其内置知识和迄今为止观察到的整个感知序列,而不是它未感知到的任何事物。从数学上讲, 智能体的行为由智能体函数描述, 该函数将任意给定的感知序列映射到一个动作。 # 4.1.1 智能体的定义 可以想象,将描述任何给定智能体的智能体函数制成表格,对大多数智能体来说这个表格会非常大,事实上是无限的(除非限制所考虑的感知序列的长度),当然,该表只是该智能体的外部特征。在内部,人工智能体的智能体函数是一种抽象的数学描述,而智能体程序是一个可以在某些物理系统中运行的具体实现。 # 4.1.1 智能体的定义 我们来看一个简单的例子——真空吸尘器。在一个由方格组成的世界中,包含一个机器人真空吸尘器智能体,其中的方格可能是脏的,也可能是干净的。考虑只有两个方格(方格A和方格B)的情况。真空吸尘器智能体可以感知它在哪个方格中以及方格是否干净。从方格A开始,智能体可选的操作包括向右移动、向左移动、吸尘或什么都不做。通常机器人采用“向前旋转轮子”和“向后旋转轮子”这样的动作。一个非常简单的智能体函数可以是:如果当前方格是脏的,就吸尘;否则,移动到另一个方格。 # 4.1.2 性能度量 人类有适用于自身的理性概念,它与成功选择产生环境状态序列的行动有关,而这些环境状态序列从人类的角度来看是可取的。但是,机器没有自己的欲望和偏好,至少在最初,性能度量是在机器设计者或者机器受众的头脑中。一些智能体设计具有性能度量的显式表示,但它也可能是完全隐式的。智能体尽管会做正确的事情,但它并不知道这是为什么。 # 4.1.2 性能度量 有时,正确地制定性能度量可能非常困难。例如,考虑真空吸尘器智能体,我们可能会用单个8小时班次中清理的灰尘量来度量其性能。然而,一个理性的智能体可以通过清理灰尘,然后将其全部倾倒在地板上,然后再次清理,如此反复,从而最大化这一性能度量值。更合适的性能度量是奖励拥有干净地板的智能体。例如,在每个时间步中,每个干净方格可以获得1分(可能会对耗电和产生的噪声进行惩罚)。作为一般规则,更好的做法是根据一个人在环境中真正想要实现的目标,而不是根据一个人认为智能体应该如何表现来设计性能度量。 # 4.1.2 性能度量 即使避免了明显的缺陷,一些棘手的问题仍然存在。例如,“干净地板”的概念是基于一段时间内的平均整洁度。然而,两个不同的智能体可以达到相同的平均整洁度,其中一个智能体工作始终保持一般水平,而另一个智能体短时间工作效率很高,但需要长时间的休息。哪种工作方式更可取,这实际上还是一个具有深远影响的哲学问题。 # 4.1.3 智能体的理性 通常,理性取决于以下4个方面: (1) 定义成功标准的性能度量; (2) 智能体对环境的先验知识; (3) 智能体可以执行的动作; (4) 智能体到目前为止的感知序列。 于是,将理性智能体定义为:对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。 # 4.1.3 智能体的理性 全知的智能体能预知其行动的实际结果,并据此采取行动,但在现实中,全知是不可能的。理性不等同于完美。理性使期望性能最大化,而完美使实际性能最大化。不要求完美不仅仅是对智能体公平的问题,关键是,如果期望一个智能体做事后证明是最好的行动,就不可能设计一个符合规范的智能体。因此,对理性的定义并不需要全知,因为理性决策只取决于迄今为止的感知序列,我们还必须确保没有无意中允许智能体进行低智的行动。 # 4.1.3 智能体的理性 理性智能体不仅要收集信息,还要尽可能多地从它的感知中学习。智能体的初始配置可以反映对环境的一些先验知识,随着智能体获得经验而被修改和增强。在一些极端情况下,环境完全是先验已知的和完全可预测的,这时智能体只需正确地运行,当然,这样的智能体是脆弱的。 如果在某种程度上智能体依赖于其设计者的先验知识,而不是自身感知和学习过程,就说该智能体缺乏自主性。理性智能体应该是自主的,应该学习如何弥补部分或不正确的先验知识。 # 4.1.4 AIGC与智能体的联系 AIGC和智能体看似不同,但它们之间实际上存在密切联系,它们在技术层面上有不同侧重点,在实际应用中往往相辅相成,共同推动着人工智能技术在内容创造、决策支持、个性化服务等领域的进步。 (1) 内容生成与交互: 智能体可以利用AIGC技术来生成更丰富的交互内容, 比如聊天机器人利用AIGC生成更自然、更个性化的对话回复, 提升用户体验。 # 4.1.4 AIGC与智能体的联系 (2) 决策支持: 智能体在做决策时, 可以利用AIGC生成的报告、分析或预测作为依据, 这些内容的生成基于大量数据和复杂模型, 帮助智能体做出更加准确和全面的判断。 (3) 自动化创作与定制化服务:在个性化服务领域,智能体通过学习用户的偏好和行为模式,可以利用AIGC技术生成定制化的内容,如个性化新闻摘要、产品推荐、教育课程等,以满足用户个性化需求。 # 4.1.4 AIGC与智能体的联系 (4) 协同工作: 在某些复杂系统中, AIGC作为智能体的一部分负责内容的创造和优化, 而智能体负责决策、规划和执行, 两者协同工作, 共同完成更复杂的任务或提供更高级的服务。 智能体是人工智能系统的一个组成部分,设计用于在特定环境中自主或半自主地执行任务。智能体可以感知环境、做出决策、学习并根据反馈调整行为。它们通常具有目标导向性,能够与用户交互、解决问题、优化流程或执行复杂的任务。智能体的应用场景非常广泛,从简单的个人助理、聊天机器人到复杂的游戏AI、自动化业务流程的机器人流程自动化(RPA)等。 PART 02 环境的本质 # 4.2 环境的本质 构建理性智能体必须考虑任务环境,而理性智能体是此问题的“解决方案”。首先指定任务环境,然后展示任务环境的多种形式。任务环境的性质直接影响到智能体程序的恰当设计。 # 4.2.1 指定任务环境 在讨论简单吸尘器智能体的理性时,必须为其指定性能度量、环境以及智能体的执行器和传感器(即PEAS,Performance、Environment、Actuator、Sensor)描述。设计智能体的第一步始终是尽可能完整地指定任务环境。我们来考虑一个更复杂的问题:自动驾驶出租车的任务环境PEAS描述(见表4-1)。 # 4.2.1 指定任务环境 表4-1 自动驾驶出租车司机任务环境的PEAS描述 <table><tr><td>智能体类型</td><td>性能度量</td><td>环境</td><td>执行器</td><td>传感器</td></tr><tr><td>自动驾驶出租车司机</td><td>安全、速度快、合法、舒适、最大化利润、对其他道路用户的影响最小化</td><td>道路、其他交通工具、警察、行人、客户、天气</td><td>转向器、加速器、制动、信号、喇叭、显示、语音</td><td>摄像头、雷达、速度表、导航、传感器、加速度表、麦克风、触摸屏</td></tr></table> # 4.2.1 指定任务环境 首先,对于自动驾驶追求的性能度量,理想的标准包括到达正确的目的地,尽量减少油耗和磨损,尽量减少行程时间或成本,尽量减少违反交通法规和其他驾驶员的干扰,最大限度地提高安全性和乘客舒适度,最大化利润。显然,其中有一些目标是相互冲突的,需要权衡。 # 4.2.1 指定任务环境 接着,出租车将面临什么样的驾驶环境?如司机必须能够在乡村车道、城市小巷以及多个车道的高速公路的各种道路上行驶。道路上有其他交通工具、行人、流浪动物、道路工程、警车和坑洼。出租车还必须与潜在以及实际的乘客互动。另外,还有一些可选项。出租车可以选择在很少下雪的南方或者经常下雪的北方运营。显然,环境越受限,设计问题就越容易解决。 # 4.2.1 指定任务环境 自动驾驶出租车的执行器包括可供人类驾驶员使用的器件,例如通过加速器控制发动机以及控制转向和制动。此外,它还需要输出到显示屏或语音合成器,以便与驾驶员以及乘客进行对话,或许还需要某种方式与其他车辆进行礼貌的或其他方式的沟通。 # 4.2.1 指定任务环境 出租车的基本传感器包括一个或多个摄像头以便观察,以及激光雷达和超声波传感器以便检测其他车辆和障碍物的距离。为了避免超速罚单,出租车应该有一个速度表,而为了正确控制车辆(特别是在弯道上),它应该有一个加速度表。要确定车辆的机械状态,需要发动机、燃油和电气系统的传感器常规阵列。像许多人类驾驶者一样,它可能需要获取北斗导航信号,这样就不会迷路。最后,乘客需要触摸屏或语音输入才能说明目的地。 # 4.2.1 指定任务环境 表4-2中简要列举了一些其他智能体类型的基本PEAS元素。这些示例包括物理环境和虚拟环境。注意,虚拟任务环境可能与“真实”世界一样复杂。例如,在拍卖和转售网站上进行交易的软件智能体,它为数百万其他用户和数十亿对象提供交易业务。 # 4.2.1 指定任务环境 表4-2 智能体类型及其PEAS描述的示例 <table><tr><td>智能体类型</td><td>性能度量</td><td>环境</td><td>执行器</td><td>传感器</td></tr><tr><td>医学诊断系统</td><td>治愈患者、降低费用</td><td>患者、医院、工作人员</td><td>用于问题、测试、诊断、治疗的显示</td><td>用于症状和检验结果的各种输入</td></tr><tr><td>卫星图像分析系统</td><td>正确分类对象和地形</td><td>轨道卫星、下行链路、天气</td><td>场景分类显示器</td><td>高分辨率数字照相机</td></tr><tr><td>零件选取机器人</td><td>零件在正确箱中的比例</td><td>零件输送带、箱子</td><td>有关节的手臂和手</td><td>摄像头、触觉和关节角度传感器</td></tr><tr><td>提炼厂控制器</td><td>纯度、产量、安全</td><td>提炼厂、原料、操作员</td><td>阀门、泵、加热器、搅拌器、显示器</td><td>温度、气压、流量、化学等传感器</td></tr><tr><td>交互英语教师</td><td>学生的考试分数</td><td>一组学生、考试机构</td><td>用于练习、反馈、发言的显示器</td><td>键盘输入、语音</td></tr></table> # 4.2.2 任务环境的属性 人工智能中可能出现的任务环境范围非常广泛,但可以确定少量的维度,并根据这些维度对任务环境进行分类。这些维度在很大程度上决定了恰当的智能体设计以及智能体实现的主要技术系列的适用性。首先列出维度,然后分析任务环境,阐明思路。 # 4.2.2 任务环境的属性 完全可观测与部分可观测:如果能让智能体的传感器在每个时间点都能访问环境的完整状态,那么就说任务环境是完全可观测的。如果传感器检测到与动作选择相关的所有方面,那么任务环境就是有效的完全可观测的,而这里的“相关”又取决于性能度量标准。完全可观测的环境容易处理,因为智能体不需要维护任何内部状态来追踪世界。由于传感器噪声大且不准确,或者由于传感器数据中缺少部分状态,环境可能部分可观测。 # 4.2.2 任务环境的属性 例如,只有一个局部灰尘传感器的真空吸尘器无法判断其他方格是否有灰尘,或者自动驾驶出租车无法感知其他司机的想法。如果智能体根本没有传感器,那么环境是不可观测的。在这种情况下,智能体的困境可能是无解的,但智能体的目标仍然可能实现。 # 4.2.2 任务环境的属性 单智能体与多智能体:单智能体和多智能体环境之间的区别似乎足够简单。例如,独自解决纵横字谜的智能体显然处于单智能体环境中,而下国际象棋的智能体则处于二智能体环境中。然而,这里也有一些微妙的问题,例如我们已经描述了如何将一个实体视为智能体,但没有解释哪些实体必须视为智能体。智能体A(例如出租车司机)是否必须将对象B(另一辆车)视为智能体,还是可以仅将其视为根据物理定律运行的对象,类似于海滩上的波浪或随风飘动的树叶? # 4.2.2 任务环境的属性 多智能体设计问题与单智能体有较大差异。例如,在多智能体环境中,通信通常作为一种理性行为出现:在某些竞争环境中,随机行为是理性的,因为它避免了一些可预测性的陷阱。 # 4.2.2 任务环境的属性 确定性与非确定性:如果环境的下一个状态完全由当前状态和智能体执行的动作决定,那么就说环境是确定性的,否则是非确定性的。原则上,在完全可观测的确定性环境中,智能体不需要担心不确定性。然而,如果环境是部分可观测的,那么它可能是非确定性的。 # 4.2.2 任务环境的属性 大多数真实情况非常复杂,以至于不可能追踪所有未观测到的方面,实际上必须将其视为非确定性的。出租车驾驶显然是非确定性的,因为无法准确地预测交通行为,例如轮胎可能会意外爆胎,发动机可能会在没有警告的情况下失灵等。虽然所描述的真空吸尘器世界是确定性的,但可能存在非确定性因素,如随机出现的灰尘和不可靠的吸力机制等。 注意“随机”与“非确定性”不同。如果环境模型显式地处理概率(如“明天的降雨可能性为 $25\%$ ”),那么它是随机的;如果可能性没有被量化,那么它是“非确定性的”(例如“明天有可能下雨”)。 # 4.2.2 任务环境的属性 回合式与序贯:许多分类任务是回合式的。例如,在装配流水线上检测缺陷零件的智能体,它需要根据当前零件做出每个决策,而无须考虑以前的决策,而且当前的决策并不影响下一个零件是否有缺陷。在回合式任务环境中,智能体的经验被划分为原子式回合,每接收一个感知执行单个动作。重要的是,下一回合并不依赖于前几回合采取的动作。但是,在序贯环境中,当前决策可能会影响未来所有决策。国际象棋和出租车驾驶是序贯的:在这些情况下,短期行为可能会产生长期影响。回合式环境下的智能体不需要提前思考,所以要比序贯环境简单很多。 # 4.2.2 任务环境的属性 静态与动态:如果环境在智能体思考时发生了变化,就说该智能体的环境是动态的,否则是静态的。静态环境容易处理,因为智能体在决定某个操作时不需要一直关注世界,也不需要担心时间的流逝。但是,动态环境会不断地询问智能体想要采取什么行动,如果它还没有决定,那就什么都不做。如果环境本身不会随着时间的推移而改变,但智能体的性能分数会改变,就说环境是半动态的。驾驶出租车显然是动态的,因为驾驶算法在计划下一步该做什么时,其他车辆和出租车本身在不断移动。在用时钟计时的情况下国际象棋是半动态的,而填字游戏是静态的。 # 4.2.2 任务环境的属性 离散与连续:这之间的区别适用于环境的状态、处理时间的方式以及智能体的感知和动作。例如,国际象棋环境具有有限数量的不同状态(不包括时钟),国际象棋也有一组离散的感知和动作。驾驶出租车是一个连续状态和连续时间的问题,出租车和其他车辆的速度和位置是一系列连续的值,并随着时间平稳地变化。出租车的驾驶动作也是连续的(转向角等)。严格来说,来自数字照相机的输入是离散的,但通常被视为表示连续变化的强度和位置。 # 4.2.2 任务环境的属性 已知与未知: 这种区别是指智能体 (或设计者) 对环境 “物理定律” 的认知状态。在已知环境中, 所有行动的结果 (如果环境是非确定性的, 则对应结果的概率) 都是既定的。显然, 如果环境未知, 智能体将不得不了解它是如何工作的, 才能做出正确的决策。 # 4.2.2 任务环境的属性 最困难的情况是部分可观测、多智能体、非确定性、序贯、动态、连续且未知的。表4-3列出许多熟悉环境的可变化属性。例如,将患者的患病过程作为智能体建模并不适合,所以我们将医疗诊断任务列为单智能体,但是医疗诊断系统还可能会应对顽固的病人和多疑的工作人员,因此环境具有多智能体方面。此外,如果将任务设想为根据症状列表进行诊断,那么医疗诊断是回合式的;如果任务包括一系列测试、评估治疗进展、处理多个患者等,那就是序贯的。 # 4.2.2 任务环境的属性 表4-3 任务环境的例子及其特征 <table><tr><td>任务环境</td><td>可观测</td><td>智能体</td><td>确定性</td><td>回合式</td><td>动静态</td><td>离散性</td></tr><tr><td>填字游戏</td><td rowspan="2">完全</td><td>单</td><td rowspan="2">确定性</td><td rowspan="6">序贯</td><td>静态</td><td rowspan="4">离散</td></tr><tr><td>限时国际象棋</td><td rowspan="4">多</td><td>半动态</td></tr><tr><td>扑克</td><td>部分</td><td rowspan="4">非确定性</td><td rowspan="2">静态</td></tr><tr><td>西洋双陆棋</td><td>完全</td></tr><tr><td>驾驶出租车</td><td rowspan="2">部分</td><td rowspan="2">动态</td><td rowspan="5">连续</td></tr><tr><td>医疗诊断</td><td rowspan="4">单</td></tr><tr><td>图片分析</td><td>完全</td><td>确定性</td><td rowspan="2">回合式</td><td>半动态</td></tr><tr><td>零件选取机器人</td><td rowspan="3">部分</td><td rowspan="3">非确定性</td><td rowspan="3">动态</td></tr><tr><td>提炼厂控制器</td><td rowspan="2">序贯</td></tr><tr><td>交互英语教师</td><td>多</td><td>离散</td></tr></table> PART 03 智能体的结构 # 4.3 智能体的结构 人工智能的工作是设计一个智能体程序实现智能体函数,即从感知到动作的映射。假设该程序将运行在某种具有物理传感器和执行器的计算设备上,称之为智能体架构。 $$ \text {智 能 体} = \text {架 构} + \text {程 序} $$ 智能体的关键组成如图4-3所示。 # 4.3 智能体的结构 图4-3 智能体的关键组成 # 4.3 智能体的结构 显然,选择的程序必须适合相应的架构。如果程序打算推荐步行这样的动作,那么对应的架构最好有腿。架构可能只是一台普通PC,也可能是一辆带有多台车载计算机、摄像头和其他传感器的机器人汽车。通常,架构使程序可以使用来自传感器的感知,然后运行程序,并将程序生成的动作选择反馈给执行器。 # 4.3.1 智能体程序 我们考虑的智能体程序都有相同的框架:将当前感知作为传感器的输入,并将动作返回给执行器。而智能体程序框架还有其他选择,例如可以让智能体程序作为与环境异步运行的协程。每个这样的协程都有一个输入和输出端口,并由一个循环组成,该循环读取输入端口的感知,并将动作写到输出端口。注意智能体程序(将当前感知作为输入)和智能体函数(可能依赖整个感知历史)之间的差异。因为环境中没有其他可用信息,所以智能体程序别无选择,只能将当前感知作为输入。如果智能体的动作需要依赖于整个感知序列,那么智能体必须记住历史感知。 # 4.3.1 智能体程序 人工智能面临的关键挑战是找出编写程序的方法,尽可能从一个小程序而不是从一个大表中产生理性行为。有4种基本的智能体程序,它们体现了几乎所有智能系统的基本原理,每种智能体程序以特定的方式组合特定的组件来产生动作。 (1) 简单反射型智能体。最简单的智能体, 根据当前感知选择动作, 忽略感知历史的其余部分。 (2) 基于模型的反射型智能体。处理部分可观测性的最有效方法是让智能体追踪它现在观测不到的部分世界。 # 4.3.1 智能体程序 也就是说,智能体应该维护某种依赖于感知历史的内部状态,从而反映当前状态的一些未观测到的方面。例如刹车问题,内部状态范围不仅限于摄像头拍摄图像的前一帧,要让智能体能够检测车辆边缘的两个红灯何时同时亮起或熄灭。对于其他驾驶任务,如变道,如果智能体无法同时看到其他车辆,则需要追踪它们的位置。 # 4.3.1 智能体程序 随着时间的推移,更新这些内部状态信息需要在智能体程序中以某种形式编码两种知识。首先,需要一些关于世界如何随时间变化的信息,这些信息大致可以分为两部分:智能体行为的影响和世界如何独立于智能体而发展。例如,当智能体顺时针转动方向盘时汽车会右转;而下雨时汽车的摄像头会被淋湿。这种关于“世界如何运转”的知识(无论是在简单的布尔电路中还是在完整的科学理论中实现)被称为世界的转移模型。 # 4.3.1 智能体程序 其次,需要一些关于世界状态如何反映在智能体感知中的信息。例如,当前面的汽车开始刹车时,前向摄像头的图像中会出现一个或多个亮起的红色区域;当摄像头被淋湿时,图像中会出现水滴状物体并部分遮挡道路。这种知识称为传感器模型。 转移模型和传感器模型结合在一起让智能体能够在传感器受限的情况下尽可能地跟踪世界的状态。使用此类模型的智能体称为基于模型的智能体。 # 4.3.1 智能体程序 (3) 基于目标的智能体。即使了解了环境的现状也并不总是能决定做什么。例如,在一个路口,出租车可以左转、右转或直行。正确的决定还取决于出租车要去哪里。换句话说,除了当前状态的描述之外,智能体还需要某种描述理想情况的目标信息,例如设定目的地。智能体程序可以将其与模型相结合,并选择实现目标的动作。 # 4.3.1 智能体程序 (4) 基于效用的智能体。在大多数环境中,仅靠目标并不足以产生高质量的行为。例如,许多动作序列都能使出租车到达目的地,但有些动作序列比其他动作序列更快、更安全、更可靠或者更便宜。这个时候,目标只是在“快乐”和“不快乐”状态之间提供了一个粗略的二元区别。更一般的性能度量应该允许根据不同世界状态的“快乐”程度来对智能体进行比较。经济学家和计算机科学家通常用效用这个词来代替“快乐”。 # 4.3.1 智能体程序 我们已经看到,性能度量会给任何给定的环境状态序列打分,因此它可以很容易地区分到达出租车目的地所采取的更可取和更不可取的方式。智能体的效用函数本质上是性能度量的内部化。如果内部效用函数和外部性能度量一致,那么根据外部性能度量选择动作,以使其效用最大化的智能体是理性的。 # 4.3.2 学习型智能体 在图灵早期的著名论文中,曾经考虑了手动编程实现智能机器的想法。他估计了这可能需要多少工作量,并得出结论,“似乎需要一些更快捷的方法”。他提出的方法是构造学习型机器,然后教它们。在人工智能的许多领域,这是目前创建最先进系统的首选方法。任何类型的智能体(基于模型、基于目标、基于效用等)都可以构建(或不构建)成学习型智能体。 # 4.3.2 学习型智能体 学习还有另一个优势:它让智能体能够在最初未知的环境中运作,并变得比其最初的能力更强。学习型智能体可分为4个概念组件(图4-4),其中,“性能元素”框表示我们之前认为的整个智能体程序,“学习元素”框可以修改该程序以提升其性能。最重要的区别在于负责提升的学习元素和负责选择外部行动的性能元素。性能元素接受感知并决定动作,学习元素使用来自评估者对智能体表现的反馈,并以此确定应该如何修改性能元素以在未来做得更好。 # 4.3.2 学习型智能体 图4-4 通用学习型智能体 # 4.3.2 学习型智能体 学习元素的设计在很大程度上取决于性能元素的设计。当设计者试图设计一个学习某种能力的智能体时,第一个问题是“一旦智能体学会了如何做,它将使用什么样的性能元素?”给定性能元素的设计,可以构造学习机制来改进智能体的每个部分。 # 4.3.2 学习型智能体 评估者告诉学习元素:智能体在固定性能标准方面的表现如何。评估者是必要的,因为感知本身并不会指示智能体是否成功。例如,国际象棋程序可能会收到一个感知,提示它已将死对手,但它需要一个性能标准来知道这是一件好事。从概念上讲,应该把性能标准看作完全在智能体之外,智能体不能修改性能标准以适应自己的行为。 # 4.3.2 学习型智能体 学习型智能体的最后一个组件是问题生成器。它负责建议动作,这些动作将获得全新和信息丰富的经验。如果性能元素完全根据自己的方式,它会继续选择已知最好的动作。但如果智能体愿意进行一些探索,并在短期内做一些可能不太理想的动作,那么从长远来看,它可能会发现更好的动作。问题生成器的工作是建议这些探索性行动。这就是科学家在进行实验时所做的。伽利略并不认为从比萨斜塔顶端扔石头本身有价值。他并不是想要打碎石头或改造不幸行人的大脑。他的目的是通过确定更好的物体运动理论来改造自己的大脑。 # 4.3.2 学习型智能体 学习元素可以对智能体图中显示的任何“知识”组件进行更改。最简单的情况是直接从感知序列学习。观察成对相继的环境状态可以让智能体了解“我的动作做了什么”以及“世界如何演变”以响应其动作。例如,如果自动驾驶出租车在湿滑路面上行驶时进行一定程度的刹车,那么它很快就会发现实际减速多少,以及它是否滑出路面。问题生成器可能会识别出模型中需要改进的某些部分,并建议进行实验,例如在不同条件下的不同路面上尝试刹车。无论外部性能标准如何,改进基于模型的智能体的组件,使其更好地符合现实几乎总是一个好主意。 # 4.3.2 学习型智能体 从计算的角度来看,在某些情况下简单但稍微不准确的模型比完美但极其复杂的模型更好。当智能体试图学习反射组件或效用函数时,需要外部标准的信息。从某种意义上说,性能标准将传入感知的一部分区分为奖励或惩罚,以提供对智能体行为质量的直接反馈。 更一般地说,人类的选择可以提供有关人类偏好的信息。例如,假设出租车不知道人们通常不喜欢噪声,于是决定不停地按喇叭以确保行人知道它即将到来。随之而来的人类行为,如盖住耳朵、说脏话甚至可能剪断喇叭上的电线,将为智能体提供更新其效用函数的证据。 # 4.3.2 学习型智能体 总之,智能体有各种组件,这些组件可以在智能体程序中以多种方式表示,因此学习方法之间似乎存在很大差异。然而,主题仍然是统一的:智能体中的学习可以概括为对智能体的各个组件进行修改的过程,使各组件与可用的反馈信息更接近,从而提升智能体的整体性能。 # 4.3.3 智能体组件的工作 智能体程序由各种组件组成,组件表示了智能体所处环境的各种处理方式。我们通过一个复杂性和表达能力不断增加的方式来描述,即原子表示、因子化表示和结构化表示。例如,我们来考虑一个特定的智能体组件,处理“我的动作会导致什么”。这个组件描述了采取动作的结果可能在环境中引起的变化。 (a)原子表示 (b)因子化表示 (C)结构化表示 图4-5 表示状态及其转移的3种方法 # 4.3.3 智能体组件的工作 图4- 5 (a) 中, 原子表示一个状态 (如B或C) 是没有内部结构的黑盒; 图4- 5 (b) 中因子化表示状态由属性值向量组成, 值可以是布尔值、实值或一组固定符号中的一个; 图4- 5 (c) 中结构化表示状态包括对象, 每个对象可能有自己的属性以及与其他对象的关系。 # 4.3.3 智能体组件的工作 在原子表示中,世界的每一个状态都是不可分割的,它没有内部结构。考虑这样一个任务:通过城市序列找到一条从某个国家的一端到另一端的行车路线。为了解决这个问题,将世界状态简化为所处城市的名称就足够了,这就是单一知识原子,也是一个“黑盒”,唯一可分辨的属性是与另一个黑盒相同或不同。搜索和博弈中的标准算法、隐马尔可夫模型以及马尔可夫决策过程都基于原子表示。 # 4.3.3 智能体组件的工作 因子化表示将每个状态拆分为一组固定的变量或属性,每个变量或属性都可以有一个值。考虑同一个驾驶问题,即我们需要关注的不仅仅是一个城市或另一个城市的原子位置,可能还需要关注油箱中的汽油量、当前的北斗导航坐标、油量警示灯是否工作、通行费、收音机频道等。两个不同的原子状态没有任何共同点(只是不同的黑盒),但两个不同的因子化状态可以共享某些属性(如位于某个导航位置),而其他属性不同(如有大量汽油或没有汽油),这使得研究如何将一种状态转换为另一种状态变得更加容易。人工智能的许多重要领域都基于因子化表示,包括约束满足算法、命题逻辑、规划、贝叶斯网络以及各种机器学习算法。 # 4.3.3 智能体组件的工作 此外,我们还需要将世界理解为存在着相互关联的事物,而不仅仅是具有值的变量。例如,我们可能注意到前面有一辆卡车正在倒车进入一个奶牛场的车道,但一头奶牛挡住了卡车的路。这时就需要一个结构化表示,可以明确描述诸如奶牛和卡车之类的对象及其各种不同的关系。结构化表示是关系数据库和一阶逻辑、一阶概率模型和大部分自然语言理解的基础。事实上,人类用自然语言表达的大部分内容都与对象及其关系有关。 PART 04 # 构建LLM智能体 # 4.4 构建LLM智能体 尽管能力出色,但LLM还只是被动的工具,它们依赖简单的执行过程,无法直接当智能体使用。智能体机制具有主动性,特别是在与环境的交互、主动决策和执行各种任务方面。另外,智能体通过挖掘LLM的潜在优势,可以进一步增强决策制定。特别是使用人工、环境或模型来提供反馈,使得智能体可以具备更深思熟虑和自适应的问题解决机制,超越LLM现有技术的局限。可以说,智能体是真正释放LLM潜能的关键,它能为LLM核心提供强大的行动能力;而另一方面,LLM能提供智能体所需要的强大引擎。可以说,LLM和智能体可以互补而相互成就。 # 4.4 构建LLM智能体 智能体根据设定的目标,确定好需要履行特定角色,自主观测感知环境,根据获得的环境状态信息,检索历史记忆以及相关知识,通过推理规划分解任 务并确定行动策略,并反馈作用于环境,以达成目标。在这个过程中,智能体持续学习,以像人类一样不断进化。基于LLM来构建一个智能体,能充分地利用LLM的各种能力,驱动不同的组成单元。 图4-6 基于LLM的智能体应用 # 4.4 构建LLM智能体 智能体本身包括观测感知模块、记忆检索、推理规划和行动执行等模块。它呈现强大能力的关键在于系统形成反馈闭环,使智能体可以持续地迭代学习,不断地获得新知识和能力。反馈除了来自环境外,还可以来自人类和语言模型。智能体不断积累必要的经验来增强改进自己,以显著提高规划能力并产生新的行为,以越来越适应环境并符合常识,更加完满地完成任务。 在执行任务过程中的不同阶段,基于LLM的智能体通过提示等方式与LLM交互获得必要的资源和相关结果。 PART 05 # 智能体驱动的商业模式 # 4.5 智能体驱动的商业模式 全球技术研究与咨询机构Gartner有一项调查显示,GAI已是组织中部署的第一大人工智能解决方案。这份调查完成于2023年第四季度。调查数据显示,来自美国、德国和英国组织的644名受访者中,有 $29\%$ 表示他们已经部署并正在使用GAI,这使得GAI成为部署最频繁的人工智能解决方案。GAI被发现比其他解决方案更常见,如图形技术、优化算法、基于规则的系统、自然语言处理和其他类型的机器学习。 # 4.5 智能体驱动的商业模式 调查还发现,利用嵌入现有应用程序(如Microsoft的Copilot for 365或Adobe Firefly)的GAI是实现GAI用例的最佳方式, $34\%$ 的受访者表示这是他们使用GAI的主要方法。这比其他选项更常见,例如使用提示工程定制GAI模型( $25\%$ )、训练或微调定制的GAI模型( $21\%$ ),或使用独立的GAI工具,如ChatGPT或Gemini( $19\%$ )。 基于以上数据,在Gartner高级总监分析师莱纳尔·拉莫斯看来,GAI正在成为企业中人工智能扩展的催化剂,为人工智能领导者创造了一个机会之窗,但也考验他们是否能够利用这一时刻并大规模提供价值。 # 4.5 智能体驱动的商业模式 作为实现GAI用例的最佳方式,将GAI技术嵌入现有应用程序,也体现于Gartner的GAI技术成熟曲线报告中。“技术成熟度在两年之内的GAI应用”和“技术成熟度在2-5年之间的增强软件工程”中,已经将这个应用趋势体现得明明白白。 GAI启用的应用程序,是指使用人工智能创建新内容(如文本、图像或代码)的系统。而人工智能增强软件工程,是指将人工智能技术整合到传统软件工程过程中,以提高生产力和减少错误。 # 4.5 智能体驱动的商业模式 在GAI技术成熟曲线报告中,还提到了自治代理。作为智能体的主体存在,自治代理的技术成熟在5到10年之间,技术的发展与应用可谓任重而道远。即便当前还处于智能体应用的初期阶段,AutoGPT、MetaGPT、AutoGen、GPTs、Coze、文心智能体、Dify等一系列智能体架构和智能体构建平台,已经彰显了它的蓬勃生机与无穷潜力。 # 4.5 智能体驱动的商业模式 Gartner的一份调研报告更是助推了这一波澜。该调研显示,目前GAI商业化落地中需要为客户提供四种关键能力:合成数据、个性化能力、对话式人工智能能力和智能体。其中,智能体已经成为一个越来越不可或缺的技术能力,智能体能够协助客户低门槛、低成本使用GAI。智能体成为GAI的四大关键能力之一,足见其在未来GAI发展与应用中的重要性,当然也预示着更广阔的市场空间。 # 4.5 智能体驱动的商业模式 因此,我们不但要了解智能体的技术特性与未来趋势,还要了解它的商业属性。下面,我们通过盘点的智能体11种商业模式,来更好地了解智能体的商业进程。 # 4.5.1 软件即服务 软件即服务(SaaS)模式是一种现代的软件交付模式,它允许用户通过互联网访问和使用基于云的软件应用程序。在这种模式下,智能体以在线服务的形式提供,极大地简化了客户的使用过程。用户无需进行复杂的本地软件安装和维护,只需通过订阅服务或根据实际使用量支付费用,即可享受到人工智能带来的便利和智能。 # 4.5.1 软件即服务 智能体在SaaS模式中扮演着重要角色,它们通常是多功能的智能助手,能够根据用户的需求执行各种任务。例如,在基于云的客户关系管理(CRM)系统中,智能体可以自动化数据输入,减少手动输入的错误和时间消耗。它们还能够通过分析历史销售数据来提供销售预测,帮助企业更好地理解市场趋势和客户需求,从而制定更有效的销售策略。 此外,智能体还能够优化营销活动,通过分析客户行为和偏好,为企业提供精准的营销建议。这些智能助手可以自动调整营销策略,确保营销活动的目标受众和内容更加精准,提高营销效果和投资回报率。 # 4.5.1 软件即服务 SaaS模式可以面向用户,可以面向企业,也可以两者兼之。不管面向哪类客户,都可以提供免费增值模式。智能体提供基本功能的免费版本,更高级的功能和能力通过付费订阅获得,并允许用户在购买前试用智能体。 SaaS模式的智能体服务通常具有高度的可扩展性和灵活性。随着企业需求的增长,服务可以轻松扩展以满足更大的工作负载,而无需进行昂贵的硬件升级。同时,智能体可以快速适应不断变化的市场环境和技术进步,确保企业始终处于竞争优势地位。 # 4.5.1 软件即服务 安全性也是SaaS模式中智能体服务的关键考虑因素。服务提供商通常会采取先进的安全措施来保护用户数据和隐私,包括数据加密、访问控制和定期安全审计。 SaaS模式下的智能体服务能力能够为企业提供了一个高效、灵活且安全的解决方案,帮助企业实现自动化、智能化的运营,提高工作效率和决策质量。随着人工智能技术的不断发展,我们可以预见,智能体将在SaaS模式中发挥越来越重要的作用,推动企业数字化转型和创新发展。 # 4.5.2 智能体即服务 智能体即服务(AaaS)是一种新兴的云计算服务模式,它将智能体作为一项服务通过云平台提供给用户。这种模式允许用户基于自身的具体需求和预算,选择订阅服务或按实际使用量支付费用,从而实现对人工智能能力的按需获取和灵活使用。 # 4.5.2 智能体即服务 AaaS模式的核心优势在于其高度的灵活性和可伸缩性。由于智能体通常托管在远程服务器上,并依托于强大的云计算资源,用户可以轻松扩展或缩减服务,以应对业务需求的波动。这种按需付费的模式大大降低了企业使用人工智能技术的门槛,使得即使是小型企业也能享受到先进的人工智能服务。在AaaS模式下,企业可以利用智能体来自动化各种业务流程,如客户服务、数据分析、市场研究、风险管理等。 # 4.5.2 智能体即服务 例如,客服智能体可以提供 $7 \times 24$ 的不间断服务,处理客户咨询和投诉,提高客户满意度;分析智能体可以挖掘大量数据,揭示业务洞察,辅助决策制定;市场研究智能体可以帮助企业快速收集和分析市场信息,优化营销策略。AaaS模式还支持快速部署和持续更新。企业无需担心软件的安装、配置和升级问题,因为服务提供商会负责这些技术细节。同时,随着人工智能技术的不断进步,智能体的能力也在不断提升,确保企业始终能够使用到最新、最强大的人工智能功能。 # 4.5.2 智能体即服务 AaaS模式能够为企业提供了一种灵活、高效、成本可控的人工智能使用方式,帮助企业快速实现数字化转型和智能化升级。随着人工智能技术的不断发展和云计算资源的日益丰富,AaaS模式有望成为企业获取人工智能能力的首选方式,推动企业创新和增长。 # 4.5.3 LLM即服务 LLM即服务(MaaS)代表了一种创新的云计算服务模式,它将先进的机器学习模型以服务的形式提供给企业用户。MaaS模式的核心在于简化了机器学习模型的集成和应用过程,使得不具备深厚数据科学背景的开发人员也能够轻松调用强大的模型,实现复杂的数据分析和处理任务。 MaaS模式的实施,为企业提供了一种高效、智能的数据分析和决策支持手段。通过MaaS,企业能够利用最新的LLM来优化其业务流程,提升服务质量,增强市场竞争力。这种服务模式不仅降低了技术门槛,还大幅减少了企业在机器学习研发和部署上的时间和成本投入。 # 4.5.3 LLM即服务 在MaaS模式下,LLM可以作为一种技术手段,进行精细化调整,以适应不同行业或领域的特定需求。例如,通过训练模型识别特定行业的术语和概念,MaaS可以帮助企业在法律、医疗、金融等领域提供更加精准的自然语言处理服务。 MaaS还能推动人工智能技术的普及和发展。它使得更多的中小企业和个人开发者能够接触并利用到最前沿的人工智能技术,从而激发创新,推动智能化转型。MaaS提供商通常会负责模型的持续更新和维护,确保用户能够获得最佳的性能和最新的功能。 # 4.5.3 LLM即服务 智能体在MaaS模式中扮演着重要角色。它们不仅作为LLM的交互界面,提供自然语言理解和生成的能力,还作为整体解决方案的一部分,帮助企业实现自动化的业务流程和智能决策。智能体可以根据用户的指令执行任务,如自动化报告生成、客户服务、内容推荐等,极大地提升了工作效率和用户体验。 MaaS模式通过将LLM以服务的形式提供,不仅降低了企业使用人工智能技术的门槛,还推动了人工智能技术的广泛应用和创新发展。随着人工智能技术的不断进步,MaaS模式有望成为企业实现智能化转型的重要途径。 # 4.5.4 机器人即服务 机器人即服务(RaaS)正逐渐成为企业自动化和智能化转型的有力工具。这种服务模式通过将机器人技术与云计算、人工智能、机器人学和自动化等先进技术相结合,为企业提供了一种灵活、低成本的解决方案。企业无需自行购买昂贵的机器人硬件,而是通过租借、代运营或仓配一体化智能仓储服务等方式,按需使用机器人技术来完成各种任务,如智能仓储、自动化生产、客户服务等。 # 4.5.4 机器人即服务 RaaS模式的最大优势在于其降低了企业在资金和能力上的门槛。中小企业甚至初创企业都能够利用这一模式,轻松实现业务流程的自动化和智能化,无需承担高昂的前期投资和维护成本。这种模式还具有高度的可扩展性,企业可以根据业务需求的变化,快速调整机器人服务的规模和范围。 RaaS模式的另一个重要优势是提高了运营效率和减少了人力成本。机器人可以不知疲倦地工作,大大提高了生产效率和服务质量。同时,机器人可以承担重复性高、风险性大或环境恶劣的工作,减轻了员工的负担,降低了人力成本。 # 4.5.4 机器人即服务 此外,RaaS模式还推动了企业的智能化升级。通过使用机器人技术,企业可以收集和分析大量数据,优化生产流程,提高决策质量。机器人还可以通过机器学习不断自我优化,提高工作性能和适应性。 尽管智能体仍处于早期发展阶段,但已经出现了许多类智能体的机器人构建平台,如coze、SKY Agent等。这些平台为用户提供了丰富的工具和资源,帮助他们构建和定制各种机器人,以满足特定的业务需求。用户可以在这些平台上构建自己的机器人,或者选择使用平台上官方或第三方开发者已经构建的机器人,大大加快了机器人应用的开发和部署速度。 # 4.5.4 机器人即服务 随着技术的不断进步和市场的逐渐成熟,RaaS模式有望成为企业自动化和智能化转型的重要途径。通过利用RaaS,企业可以更快地响应市场变化,提高竞争力,实现可持续发展。同时,RaaS模式也为机器人技术的创新和应用提供了更广阔的空间,推动了整个行业的发展和进步。 # 4.5.5 智能体商店 OpenAI推出的GPT Store,率先开启了智能体商店模式,开创了智能体新的应用方式。GPT Store的构想类似于苹果的Apple Store,但它是一个专门提供基于生成式预训练Transformer(GPT)模型服务的虚拟商店。这个平台不仅销售各种GPT模型,还提供了丰富的服务和资源,使用户能够根据自己的特定需求定制和优化人工智能解决方案。 # 4.5.5 智能体商店 在GPT Store中,用户可以浏览和选择不同功能的GPT模型,这些模型可能擅长文本生成、语言翻译、问题解答或其他特定任务。用户可以根据自己的应用场景,如教育、医疗、金融等,选择最合适的模型。GPT Store还提供了一系列的工具和资源,帮助用户对选定的模型进行进一步的训练和调优,以提升模型的性能和适应性。 # 4.5.5 智能体商店 GPT Store的商业模式基于提供GPT模型及相关工具的服务,通过在线商店的形式向用户销售。这种模式的优势在于其灵活性和便捷性,用户可以根据自己的需求和预算,选择购买所需的模型和服务。对于OpenAI而言,这种模式不仅开辟了新的收入来源,也扩大了其在人工智能领域的影响力。 # 4.5.5 智能体商店 GPT技术的不断进步,使得GPT Store的商业模式也在不断创新。未来,GPT Store可能会推出更多定制化的解决方案,如特定行业的人工智能模型、高级API服务、在线教育工具等,以满足用户日益多样化的需求。此外,GPT Store还可能通过引入第三方开发者和服务提供商,进一步丰富其服务内容和提升用户体验。 # 4.5.5 智能体商店 此外,智能体商店模式也是一种通过共创方式推进人工智能业务的模式。例如飞书和钉钉等企业充分发挥LLM的通用能力,从而实现盈利。还有Coze、文心智能体、天工Sky Agents、智谱清言、腾讯元器、Dify等智能体构建平台,也属于这种模式。 # 4.5.5 智能体商店 智能体商店模式的成功,已经吸引了许多智能体构建平台的关注。这些平台通过提供智能体商店,不仅能够为用户提供更多的人工智能应用选择,也能够促进平台内的应用创新和生态建设。随着人工智能技术的普及和应用领域的拓展,智能体商店模式有望成为智能体应用的主流模式,推动整个人工智能行业的发展。 # 4.5.5 智能体商店 总体来看,智能体商店模式为人工智能技术的商业化提供了新的思路和途径。它通过提供灵活、便捷的服务,降低了用户使用人工智能技术的门槛,同时也为企业带来了新的商业机会。随着技术的不断发展和市场的成熟,智能体商店模式有望在未来发挥更大的作用,推动人工智能技术的创新和应用。 # 4.5.6 消费者服务 消费者服务模式是一种针对广大终端用户的商业模式,它通过整合人工智能技术,尤其是智能体,来提供定制化和个性化的消费者体验。这种模式的核心在于无缝集成和个性化服务,以满足用户的多样化需求。 在这种模式下,智能助理设备,如亚马逊的Alexa或谷歌助手,扮演着重要角色。这些设备通过语音交互为用户提供便捷的信息查询、日程管理、家居控制等服务。随着技术的进步,这些智能助理正变得更加智能,能够理解复杂的指令,提供更加人性化的服务。 # 4.5.6 消费者服务 智能家居控制系统也是消费者服务模式的重要组成部分。通过集成智能体,智能家居系统能够学习用户的行为模式,自动调整家庭环境,如灯光、温度、安全系统等,以提升居住的舒适度和安全性。这些系统可以通过手机应用或语音命令进行控制,为用户提供了极大的便利。 为了实现这些服务,企业通常会采用多种盈利方式。硬件销售是最直接的收入来源,用户购买智能设备来享受服务。应用内购买提供了额外的收入渠道,用户可以购买增值服务或虚拟商品。此外,一些服务可能会结合广告模式,通过展示相关广告来创造收益。 # 4.5.6 消费者服务 智能体越来越多地用于客户服务,以处理常规查询和支持任务,这也催生了一种自动化客户服务。企业可以根据交互量或通过固定订阅费支付这些服务,减少对人工客户服务代表的需求,并提高服务可用性。 值得注意的是,客户端侧LLM部署带来的混合人工智能技术,将进一步提升智能体的性能和响应速度。这种技术允许人工智能模型在用户的设备上运行,减少了对云端服务器的依赖,降低了延迟,提高了隐私保护,将使得智能体应用更加迅速、高效,为用户提供更加流畅的体验。 # 4.5.6 消费者服务 消费者服务模式通过融合智能体技术,能够为用户提供了无缝、个性化的体验,并通过硬件销售、应用内购买和广告等多种方式实现盈利。随着混合人工智能技术的引入,这种模式将进一步提高智能体应用的效率和普及度,推动人工智能技术的商业化和消费者化。 # 4.5.7 企业解决方案 企业解决方案模式是一种面向特定行业或企业的人工智能服务方法,它侧重于解决复杂的业务挑战或优化关键的业务流程。这种模式下,智能体供应商提供的不仅是通用的技术产品,而是深入理解客户业务需求后,提供的定制化智能解决方案。 # 4.5.7 企业解决方案 在这种模式中,人工智能供应商首先与企业紧密合作,详细了解其业务流程、痛点和目标。通过这一过程,供应商能够设计出符合企业特定需求的智能体,如为制造业设计的供应链优化系统,或是为医疗行业定制的预防性维护系统。这些智能体能够深入企业的核心业务,提供精准的数据分析、流程优化和决策支持。 其中,人工智能机构通常也会提供定制的咨询服务,帮助企业整合特定需求的人工智能解决方案。这包括开发定制的人工智能工具或系统,价格基于项目的复杂性和范围。 # 4.5.7 企业解决方案 定制化的人工智能解决方案往往涉及到一次性的项目启动费用,以及可能的周期性服务费用,用于覆盖模型的训练、部署、维护和升级。这种服务模式为企业带来了显著的价值,包括提高效率、降低成本、增强竞争力,并帮助企业在市场中保持领先地位。 例如,在制造业中,智能体可以监控生产线上的各种参数,预测设备故障,减少停机时间,优化库存管理,从而实现更高效的生产计划。在金融行业,智能体能够分析市场趋势,评估风险,自动化交易决策,提高投资回报。 # 4.5.7 企业解决方案 此外,智能体在企业解决方案中的应用还包括客户服务自动化、个性化营销策略、智能合同分析等。通过自然语言处理和机器学习技术,智能体能够提供个性化的客户体验,自动化常规的客服任务,同时在营销活动中实现更精准的目标定位。 智能体企业解决方案,可以是某款工具、软件、平台或者服务,通过联合技术、产品、服务等生态构建起整体解决方案。 # 4.5.7 企业解决方案 比如钉钉的AI助理解决方案,就基于人工智能PaaS系统提供了LLM调用、专有模型训练和企业应用接入的底层PaaS能力。企业可以基于这个平台创建符合需求的AI助理,如招聘、财务等,而个人用户则可以快速创建个性化助手,助力工作、旅游等。 # 4.5.7 企业解决方案 企业解决方案模式的成功实施,需要供应商具备深厚的行业知识和技术专长。这种模式将越来越受到企业的欢迎,因为它能够为企业带来可量化的商业利益,并推动企业在数字化转型的道路上迈出坚实的步伐。企业解决方案模式通过提供定制化的智能体服务,帮助企业解决特定的业务挑战,优化关键流程,实现业务目标。 # 4.5.8 按需平台 按需平台模式提供了一种灵活且高效的人工智能服务获取方式,尤其适合需要快速集成人工智能能力而无需自行研发的企业或开发者。这种模式允许用户根据自己的具体需求,从平台上选择并使用包括智能体在内的各种人工智能服务。 # 4.5.8 按需平台 在这种模式下,平台提供了一系列API服务,覆盖了从文本分析、语音转文本、图像识别到自然语言处理等多种人工智能功能。这些服务通常以API的形式封装了复杂的人工智能算法和模型,使得用户可以轻松地在自己的应用程序中实现人工智能功能,而无需深入了解背后的技术细节。 例如,文本分析API可以帮助企业自动化内容审核、情感分析或主题分类;语音转文本API可以支持语音交互应用的开发;图像识别API则可以用于自动化图像分类、对象检测等任务。这些API服务的易用性和多样性,极大地扩展了人工智能技术的应用范围。 # 4.5.8 按需平台 计费模式是按需平台模式的另一个关键特点。用户只需根据自己的使用量支付费用,通常是按照API调用的次数或处理的数据量来计费。这种按用量计费的模式,使得企业可以更好地控制成本,避免在不经常使用的情况下支付高额的固定费用。 Google Cloud Vision和IBM Watson是按需平台模式的典型例子。Google Cloud Vision提供了强大的图像识别服务,而IBM Watson则提供了包括自然语言理解、语音识别在内的多种人工智能服务。这些服务的用户遍布全球,涵盖了从初创企业到大型企业的广泛需求。 # 4.5.8 按需平台 随着应用市场的扩大,广大平台可能会提供更多的人工智能服务,覆盖更多的行业和应用场景。同时,也可能通过引入更先进的人工智能模型和算法,提高服务的性能和准确性。 按需平台模式将为企业和开发者提供了一种快速、灵活且成本效益高的人工智能服务获取方式。随着人工智能技术的不断发展,这种模式有望成为人工智能服务市场的主流,推动人工智能技术的广泛应用和创新。 # 4.5.9 数据和分析 数据和分析模式是一种以数据为核心的商业智能服务,它专注于提供深入的市场洞察、客户行为分析以及其他关键数据点的分析服务。这种模式对于希望基于数据做出更明智业务决策的企业来说至关重要。 在这种模式下,技术供应商通常会推出一系列数据类的智能体服务,这些服务能力能够处理和分析大量数据,提取有价值的信息和趋势。企业可以根据自己的需求直接使用这些标准化的智能体服务,或者要求供应商提供定制化的解决方案,以满足特定的业务需求。 # 4.5.9 数据和分析 比如,一些智能体采用数据即服务模式(DaaS),处理和分析大型数据集以提供可操作的见解。企业订阅以访问实时数据分析和报告,帮助他们做出明智的决策。 这些数据驱动的智能体能够分析市场趋势,预测行业发展方向,帮助企业把握市场机会。通过对客户行为的深入分析,智能体可以揭示消费者的需求和偏好,从而指导企业改进产品设计,优化产品功能,以更好地满足市场需求。智能体还能够分析客户服务过程中产生的数据,帮助企业识别服务中的不足之处,提升客户服务质量。通过这些数据洞察,企业可以制定更加精准的营销战略,提高营销活动的转化率和ROI(投资回报率)。 # 4.5.9 数据和分析 服务提供商的收费模式通常非常灵活,可以根据项目、订阅服务或数据访问量等方式进行收费。按项目收费意味着企业为特定的数据分析项目支付一次性费用;订阅服务则允许企业在一定时间内获得持续的服务和支持;按数据访问量收费则根据企业使用的数据量来计算费用。 为了保护企业的数据安全和隐私,服务提供商通常会采取严格的数据管理和安全措施,确保客户数据的安全和保密。同时,服务提供商也会遵守相关的数据保护法规和标准,避免数据泄露和滥用的风险。 # 4.5.9 数据和分析 随着大数据和人工智能技术的不断发展,数据和分析模式的应用范围将越来越广泛。企业将越来越依赖这些服务来获取数据洞察,优化业务流程,提升竞争力。服务提供商也将继续创新,提供更加智能、高效和安全的数据分析服务,帮助企业实现数据驱动的决策和增长。 # 4.5.10 技术许可 技术许可模式是一种知识产权的商业化途径,这种模式为企业提供了一种获取和应用前沿人工智能技术的方式,而无需投入大量资源自行研发。 在技术许可模式中,供应商与被授权公司之间会签订一份许可协议,明确授权的范围、期限、费用结构和双方的权利与义务。为了保护双方的利益,许可协议中通常会包含保密条款、技术改进的归属权、技术支持和更新的条款等。 # 4.5.10 技术许可 此外,协议还可能涉及技术培训、市场推广支持、质量保证等方面的合作内容。这种模式的优势在于其灵活性和风险分担。技术供应商能够通过授权费和使用费获得收入,同时将技术推广到更广泛的市场。被授权公司则能够利用现有的技术加速产品开发,减少研发成本和时间。技术许可模式还允许被授权公司根据市场需求和自身战略调整技术应用的方向和深度。 # 4.5.10 技术许可 技术许可模式在人工智能领域尤其具有吸引力,因为人工智能技术的快速发展和广泛应用为技术供应商和被授权公司提供了巨大的商机。人工智能公司也可以与其他企业建立合作或许可协议。这些合作允许将人工智能技术整合到现有产品或服务中,通过许可费用或利润分成产生收入。随着人工智能技术的不断进步,技术许可模式有望成为推动人工智能创新和商业化的重要途径。 # 4.5.11 众包和协作 众包和协作模式是一种结合了人工智能与人类劳动力的创新工作机制,它通过智能体来优化和分配任务给网络上的人类工作者。这种模式在多个领域展现出其独特的价值和效率,包括数据清洗、内容审核、数据标注等。 在众包平台中,智能体扮演着任务分配和流程管理的核心角色。它们利用先进的算法来分析任务需求,智能匹配最合适的工作者,并确保任务分配的公平性和效率。智能体还能够监控任务进度,实时跟踪工作者的工作表现,从而确保任务按时完成且质量达标。 # 4.5.11 众包和协作 数据清洗是众包模式中的一项关键服务,智能体在此过程中负责识别和指派重复或不一致的数据给工作者,由他们进行核实和修正。这不仅提高了数据处理的准确性,还加快了整个数据清洗的过程。 内容审核是另一个智能体发挥作用的领域。随着互联网内容的爆炸性增长,人工审核已经无法满足需求。智能体可以预筛选内容,识别潜在的问题,如版权侵犯、不适当内容等,并将这些内容提交给审核人员进行最终判断。这种方式极大地提高了审核工作的效率和准确性。 # 4.5.11 众包和协作 数据标注服务是机器学习和人工智能训练过程中不可或缺的一环。智能体在此模式下负责将未标注的数据分配给工作者,指导他们进行准确的数据分类和标记。这些标注后的数据将被用于训练AI模型,提高模型的识别和预测能力。 智能体还具备学习能力,能够根据任务执行的历史数据不断优化任务分配策略,提升任务与工作者之间的匹配度。这种自我优化的能力使得众包平台能够适应不断变化的任务需求和工作者队伍的构成。 # 4.5.11 众包和协作 众包和协作模式的计费通常基于完成任务的数量和复杂度,这种灵活的定价方式吸引了全球范围内的工作者参与。同时,这种模式也为企业提供了一个成本效益高的解决方案,以应对劳动力市场的变化和业务需求的波动。随着技术的进步和全球化的发展,众包和协作模式将继续扩展其应用范围,智能体将在更多领域发挥作用,推动企业创新和行业变革。通过优化任务分配和管理流程,这种模式将进一步提高工作效率,为企业和工作者创造更多价值。 # 4.5.11 众包和协作 在探索了智能体的11种商业模式之后,我们可以看到这些模式如何相互交织,共同推动着人工智能技术的商业化和创新。从传统的技术许可到现代的按需平台模式,每一种商业模式都以其独特的方式解决了市场的需求,为企业提供了增长和适应变化的策略。 随着技术的不断进步和市场需求的不断演变,智能体的商业模式将继续发展和演变。企业需要保持灵活性,适应这些变化,同时不断创新,以保持竞争优势。智能体的潜力是巨大的,它们正在成为企业运营和决策过程中不可或缺的一部分。 # 4.5.11 众包和协作 未来,我们可以预见智能体将在更多领域展现其价值,从提高效率到创造全新的服务和产品。这些智能系统将继续推动商业世界无限延展,为人类社会带来深远的影响。随着我们步入这个充满智能和自动化的新时代,智能体的商业模式将是我们探索和利用这一强大技术的关键。