输入“/”快速插入内容

多智能体之5 种不同类型的 AI Agents

2024年7月15日修改
前言
了解AI Agent:
通常而言,AI Agents 可以根据其智能水平和能力进行分类划分。根据 Russell & Norvig 的所述,AI Agents 主要分为五种类型,每种类型具有其独特的特点和应用场景。
每种类型的 AI Agents 都有其优点和局限性,使其适用于不同的应用程序和环境。这里,我们针对每种类型进行更详细的探索以便进一步深入了解它们的功能、优势和应用程序的适用性。根据具体的问题和需求,选择合适的 AI Agents 类型可以提高系统的性能和效果。
Simple Reflex Agents - 简单反射代理
AI 中的这些类型的代理,例如简单的反射代理和基于模型的反射代理,通过感知环境的当前状态来采取行动。它们的行动并不基于任何既定模型或先前的信息,而是依赖于对环境的充分观察。这些代理遵循 条件行动规则 ,也就是说,往往根据感知到的条件来决定采取对应的行动。
举个例子
打个比方,假设我们开车的过程中,看到路上有行人横穿马路时,潜意识地果断采取刹车措施以避免交通事故。像这种会根据事先设定的规则,不需要建立复杂的模型或依赖先前的信息,而是根据当前的感知情况来做出决策。
这种 Reflex Agents 的成功取决于对环境的充分观察。如果代理能准确感知到行人危险操作的存在,它将能够及时采取行动并避免车祸发生。然而,如果代理对环境的感知不准确或遗漏了一些重要信息,它可能无法做出适当的决策。
特点
这些反射代理类型在行动选择上依赖于当前的感知和条件规则,而不需要事先建立模型或依赖先前的信息。这种设计模式使得它们能够快速做出反应, 适用于一些简单的、实时性强的任务和环境 。然而,对于更复杂的问题和环境,可能需要更高级的代理类型,如基于目标的代理、基于实用程序的代理或学习代理,以便进行更深入的推理和决策。
存在的问题
通常而言,Simple Reflex Agents 设计方法存在一些问题,这些问题限制了它们的智能水平和适应性,具体涉及如下几个方面:
1、有限的智能
Simple Reflex Agent 是基于固定的条件-动作规则构建,因此,它们的智能行为受限于事先定义好的规则。由于缺乏复杂的推理和学习能力,导致 Simple Reflex Agent无法进行灵活的决策和问题解决。
2、受限的感知能力
除了上述的智能因素外,Simple Reflex Agent 也需要充分的可观察性,即只能根据当前环境状态的可感知部分来采取行动。它们无法处理环境中不可感知的信息,这可能导致决策的局限性。代理无法考虑到隐藏或间接的因素,从而可能做出不完全准确或不理想的决策。
3、缺乏环境适应性
由于基于固定的条件-动作规则的有限智能,Simple Reflex Agents 无法适应环境的变化。当环境发生变化时,便无法自动调整或学习新的行为模式,从而导致可能无法有效地应对新的情况。
Model-Based Reflex Agents - 基于模型的反射代理
其实,从本质上来讲,相比于 Simple Reflex Agents,Model-Based Reflex Agents 采用更多基于模型的代理和内部状态来做出决策,即使在部分可观察的环境中也能做到如此。这种代理类型不仅根据当前感知的情况,还会追踪其感知历史,并利用这些信息来指导行动选择。
举个例子
一个典型的基于模型的反射代理的例子是亚马逊的 Bedrock 系统。Bedrock 利用模型、见解和预测结果来做出决策。通过使用真实数据来完善模型,并提前规划各种可能性,Bedrock 能够有效地管理复杂任务并适应环境的变化。
Bedrock 系统的关键在于其能够建立环境模型,并利用该模型进行推理和预测。这使得代理能够对环境中不可观察或部分观察的因素做出推断,并做出相应的决策。此外,Bedrock 系统还能够根据先前的感知历史来调整行动选择,从而提高决策的质量和适应性。
特点
Model-Based Reflex Agents 充分利用了代理 内部状态和建模能力 ,使其在面对复杂任务和动态环境时能够更加灵活、智能地做出决策。这种代理设计方法通过整合感知、模型和推理,提供了更高级的智能和适应性,为解决复杂问题提供了一种有效的方法。
基于 Model-Based Reflex Agents 在决策过程中涉及两个基本因素,即模型和内部状态。这两个因素对于代理的智能和适应性至关重要。
1、模型: Model-Based Reflex Agents 通过寻找与当前情况相匹配的条件规则来工作。这个模型具有内置的历史记录和关于环境的信息。在 AI 中,这种代理可以根据模型使用多种与条件相关的动作。模型允许代理在部分可观察的环境中进行行动选择和决策,可以利用先前的感知和经验来推断未观察到的环境因素,并根据这些推断做出决策。
2、内部状态: 代理必须了解自身的内部状态,这个状态是由当前和过去的感知所注册和记录的。当前状态储存在代理内部,它是一种典型的结构,用于描述环境中不可见部分。为了更新内部状态,代理必须了解环境是如何自发演化的(不论智能体如何行动),以及智能体的行为将如何影响环境。通过对内部状态的维护和追踪,代理能够对环境的动态变化做出反应,并相应地调整其决策。
Goal-Based Agents - 基于目标的代理
Goal-Based Agents 是一种 高度适应性强 的实体, 利用知识和搜索算法 来选择能够最佳实现其目标的选项。此种代理设计方法通常应用于机器人、计算机视觉和自然语言处理等领域。
Goal-Based Agents 依赖于知情的搜索算法和规划,以有效地执行任务。这些代理通过对可能的行动序列进行搜索,并利用启发式方法和领域专家知识来指导搜索过程,以找到最优的解决方案。
特点
通常而言,Goal-Based Agents 具有灵活性的优势,因为可以轻松地修改代理程序中的知识和算法,以适应新的情况和目标。这意味着当环境发生变化或者任务要求发生改变时,代理可以通过更新其知识库和调整搜索算法来适应新的要求。这种灵活性使得基于目标的代理能够适应复杂和动态的环境,并具备处理各种任务的能力。
此外,基于目标的代理是一种高级的代理设计方法,结合了 知识表示、搜索算法和规划技术 ,以实现智能决策和问题解决。通过利用知识和搜索能力,这种代理能够在不同领域和应用中表现出色,并具备适应新情况和目标的能力。
Utility-based agents -基于效用的代理
Utility-Based Agents 是一种根据其目标做出决策并评估多个场景以最大化预期效用函数的代理方法。此种代理设计方法往往涉及以下关键点:
1、为不同的状态分配数值: Utility-Based Agents 会为不同的状态分配数值,这些数值代表了该状态下的成功或幸福程度。通过对状态赋予数值,代理能够对不同状态的优劣进行比较,并基于这些数值评估决策的效果。
2、比较每个状态下不同行动的结果: Utility-Based Agents 会比较在每个状态下采取不同行动的结果,并将这些结果与预期效用函数进行比较。通过评估不同行动的结果,代理能够选择那些能够最大化预期效用的行动。
3、根据效用价值做出决策: Utility-Based Agents 会根据效用价值来做出决策。效用价值是基于代理对不同状态的评估和对行动结果的比较所得出的价值。代理会选择那些具有最高效用价值的行动,以实现其目标并最大化预期效用。
从某种意义上来说,Utility-Based Agents 可以被认为是一种理性智能体,特别在面对复杂和不确定的情况下具有重要作用。这种代理能够考虑多种因素和潜在结果,并通过比较效用价值来做出最优决策。通过权衡不同的选择并选择那些能够最大化预期效用的行动,Utility-Based Agents 能够在面对挑战和不确定性的环境中表现出卓越的决策能力。
Learning Agents - 学习代理
Learning Agents 是 AI 领域中的关键组件,能够利用当前和以前的经验,避免不必要的行为,并学习新的选项以提高性能。此种类型代理能够将感知能力整合到早期未见的环境观察中,并将其存储为内部状态,从而为未来的决策和行动提供有用的信息。因此,Learning Agents 不仅仅是执行任务,还包括研究和规划。
举个例子
打个比方,自动驾驶是一个典型的基于高级代理的应用,可以通过利用内部状态和学习来避开交通拥堵路线,或自动调整车速和车内温度等控制参数。通过感知环境的变化并将其纳入内部状态,自动驾驶可以做出智能的决策,以提供更高效、安全和舒适的驾乘体验。
特点