常见的Agent架构有哪些?例如ReAct、Self-Ask等。

题目

常见的Agent架构有哪些?例如ReAct、Self-Ask等。

正确答案

常见的Agent架构旨在指导LLM如何结合推理和行动来解决问题。以下是一些典型的架构:

  1. ReAct (Reasoning and Acting)

    • 核心思想:将推理(Reasoning)和行动(Acting)交织进行
    • 工作流程
      1. 思考(Thought):LLM分析当前状态和目标,进行推理,决定下一步行动
      2. 行动(Action):执行选定的行动(如调用工具、查询API)
      3. 观察(Observation):获取行动的结果或环境反馈
      4. 重复以上步骤,直到任务完成
    • 优势:结构清晰,易于理解和实现,能够处理需要外部信息的任务
    • 应用:问答、任务执行、信息检索等
  2. Self-Ask

    • 核心思想:通过提问中间问题来引导推理过程
    • 工作流程
      1. LLM判断是否需要提出后续问题来帮助回答最终问题
      2. 如果需要,生成一个后续问题
      3. 调用外部工具(如搜索引擎)回答该后续问题
      4. 将后续问题的答案整合到上下文中
      5. 重复此过程,直到能够回答原始问题
    • 优势:适用于需要分解复杂问题、逐步获取信息的场景
    • 应用:复杂问答、事实核查
  3. Plan-and-Solve

    • 核心思想:先制定详细计划,然后按计划执行
    • 工作流程
      1. 规划(Planning):LLM根据目标生成详细的步骤计划
      2. 执行(Solving):按计划逐步执行每个步骤,可能涉及调用工具
    • 优势:对于目标明确、步骤清晰的任务效果较好
    • 缺点:对环境变化的适应性可能较差,难以处理意外情况
  4. Chain of Thought (CoT)

    • 核心思想:引导LLM生成详细的思考过程或推理链,而不仅仅是最终答案
    • 工作流程:通过提示(如"Let’s think step by step")让LLM输出中间推理步骤
    • 优势:提高LLM在复杂推理任务上的表现
    • 注意:严格来说CoT是一种提示技巧,但常被用作Agent推理的基础
  5. Tree of Thoughts (ToT)

    • 核心思想:探索多种不同的推理路径,形成思维树
    • 工作流程
      1. LLM在每个思考步骤生成多个可能的想法或下一步
      2. 对这些想法进行评估(如使用LLM自我评估)
      3. 选择最有希望的想法进行扩展,或进行回溯
    • 优势:适用于需要探索和评估多种可能性的复杂问题
    • 缺点:计算开销大
  6. Reflection / Self-Correction

    • 核心思想:Agent能够反思自己的行为和结果,并进行修正
    • 工作流程
      1. Agent执行任务并生成初步结果
      2. LLM对结果进行评估和反思,识别错误或不足
      3. 根据反思结果修正计划或重新执行部分步骤
    • 优势:提高结果的准确性和鲁棒性

这些架构不是互斥的,实际的Agent系统常常会结合多种架构的特点。例如,一个Agent可能使用ReAct框架,但在思考步骤中采用CoT或ToT,并加入Reflection机制。