常见的Agent架构有哪些？例如ReAct、Self-Ask等。

题目

常见的Agent架构有哪些？例如ReAct、Self-Ask等。

正确答案

常见的Agent架构旨在指导LLM如何结合推理和行动来解决问题。以下是一些典型的架构：

ReAct (Reasoning and Acting)：
- 核心思想：将推理(Reasoning)和行动(Acting)交织进行
- 工作流程：
  1. 思考(Thought)：LLM分析当前状态和目标，进行推理，决定下一步行动
  2. 行动(Action)：执行选定的行动(如调用工具、查询API)
  3. 观察(Observation)：获取行动的结果或环境反馈
  4. 重复以上步骤，直到任务完成
- 优势：结构清晰，易于理解和实现，能够处理需要外部信息的任务
- 应用：问答、任务执行、信息检索等
Self-Ask：
- 核心思想：通过提问中间问题来引导推理过程
- 工作流程：
  1. LLM判断是否需要提出后续问题来帮助回答最终问题
  2. 如果需要，生成一个后续问题
  3. 调用外部工具(如搜索引擎)回答该后续问题
  4. 将后续问题的答案整合到上下文中
  5. 重复此过程，直到能够回答原始问题
- 优势：适用于需要分解复杂问题、逐步获取信息的场景
- 应用：复杂问答、事实核查
Plan-and-Solve：
- 核心思想：先制定详细计划，然后按计划执行
- 工作流程：
  1. 规划(Planning)：LLM根据目标生成详细的步骤计划
  2. 执行(Solving)：按计划逐步执行每个步骤，可能涉及调用工具
- 优势：对于目标明确、步骤清晰的任务效果较好
- 缺点：对环境变化的适应性可能较差，难以处理意外情况
Chain of Thought (CoT)：
- 核心思想：引导LLM生成详细的思考过程或推理链，而不仅仅是最终答案
- 工作流程：通过提示(如"Let’s think step by step")让LLM输出中间推理步骤
- 优势：提高LLM在复杂推理任务上的表现
- 注意：严格来说CoT是一种提示技巧，但常被用作Agent推理的基础
Tree of Thoughts (ToT)：
- 核心思想：探索多种不同的推理路径，形成思维树
- 工作流程：
  1. LLM在每个思考步骤生成多个可能的想法或下一步
  2. 对这些想法进行评估(如使用LLM自我评估)
  3. 选择最有希望的想法进行扩展，或进行回溯
- 优势：适用于需要探索和评估多种可能性的复杂问题
- 缺点：计算开销大
Reflection / Self-Correction：
- 核心思想：Agent能够反思自己的行为和结果，并进行修正
- 工作流程：
  1. Agent执行任务并生成初步结果
  2. LLM对结果进行评估和反思，识别错误或不足
  3. 根据反思结果修正计划或重新执行部分步骤
- 优势：提高结果的准确性和鲁棒性

这些架构不是互斥的，实际的Agent系统常常会结合多种架构的特点。例如，一个Agent可能使用ReAct框架，但在思考步骤中采用CoT或ToT，并加入Reflection机制。