常见的Agent架构有哪些?例如ReAct、Self-Ask等。
常见的Agent架构有哪些?例如ReAct、Self-Ask等。
常见的Agent架构旨在指导LLM如何结合推理和行动来解决问题。以下是一些典型的架构:
-
ReAct (Reasoning and Acting):
- 核心思想:将推理(Reasoning)和行动(Acting)交织进行
- 工作流程:
- 思考(Thought):LLM分析当前状态和目标,进行推理,决定下一步行动
- 行动(Action):执行选定的行动(如调用工具、查询API)
- 观察(Observation):获取行动的结果或环境反馈
- 重复以上步骤,直到任务完成
- 优势:结构清晰,易于理解和实现,能够处理需要外部信息的任务
- 应用:问答、任务执行、信息检索等
-
Self-Ask:
- 核心思想:通过提问中间问题来引导推理过程
- 工作流程:
- LLM判断是否需要提出后续问题来帮助回答最终问题
- 如果需要,生成一个后续问题
- 调用外部工具(如搜索引擎)回答该后续问题
- 将后续问题的答案整合到上下文中
- 重复此过程,直到能够回答原始问题
- 优势:适用于需要分解复杂问题、逐步获取信息的场景
- 应用:复杂问答、事实核查
-
Plan-and-Solve:
- 核心思想:先制定详细计划,然后按计划执行
- 工作流程:
- 规划(Planning):LLM根据目标生成详细的步骤计划
- 执行(Solving):按计划逐步执行每个步骤,可能涉及调用工具
- 优势:对于目标明确、步骤清晰的任务效果较好
- 缺点:对环境变化的适应性可能较差,难以处理意外情况
-
Chain of Thought (CoT):
- 核心思想:引导LLM生成详细的思考过程或推理链,而不仅仅是最终答案
- 工作流程:通过提示(如"Let’s think step by step")让LLM输出中间推理步骤
- 优势:提高LLM在复杂推理任务上的表现
- 注意:严格来说CoT是一种提示技巧,但常被用作Agent推理的基础
-
Tree of Thoughts (ToT):
- 核心思想:探索多种不同的推理路径,形成思维树
- 工作流程:
- LLM在每个思考步骤生成多个可能的想法或下一步
- 对这些想法进行评估(如使用LLM自我评估)
- 选择最有希望的想法进行扩展,或进行回溯
- 优势:适用于需要探索和评估多种可能性的复杂问题
- 缺点:计算开销大
-
Reflection / Self-Correction:
- 核心思想:Agent能够反思自己的行为和结果,并进行修正
- 工作流程:
- Agent执行任务并生成初步结果
- LLM对结果进行评估和反思,识别错误或不足
- 根据反思结果修正计划或重新执行部分步骤
- 优势:提高结果的准确性和鲁棒性
这些架构不是互斥的,实际的Agent系统常常会结合多种架构的特点。例如,一个Agent可能使用ReAct框架,但在思考步骤中采用CoT或ToT,并加入Reflection机制。