跳到主要内容

Agent 核心概念

什么是 Agent

Agent(智能体) 是一种以大语言模型(LLM)为"大脑",能够自主感知环境、进行推理规划,并调用外部工具执行复杂任务的系统。

LLM(大模型) = 大脑(项目经理)→ 负责思考、规划、决定下一步做什么
Tools(工具) = 手脚(执行专员)→ 负责执行具体操作
Agent = 大脑 + 手脚 + 循环机制 → 不断"思考-行动-观察"来解决问题

Agent的本质可以被理解为一种高级的提示工程(Prompt Engineering)应用范式,开发者通过精心设计的提示词模板,引导LLM模仿人类的思考与执行方式,使其能够自主地分解任务、选择工具、调用工具并整合结果,最终完成复杂的任务。

┌─────────────────────────────────────────────────────────┐
│ Agent 智能体 │
├─────────────────────────────────────────────────────────┤
│ 感知模块 (Perception) → 接收文本、图像、语音输入 │
│ ↓ │
│ 认知中枢 (Brain) → LLM 推理 + RAG 检索 │
│ ↓ │
│ 记忆系统 (Memory) → 短期记忆 + 长期记忆 │
│ ↓ │
│ 工具生态 (Tools) → API调用、数据库访问 │
│ ↓ │
│ 执行引擎 (Action) → 执行任务并反馈结果 │
└─────────────────────────────────────────────────────────┘

环境感知 → 任务规划 → 工具调用 → 执行反馈 → 自我反思 → 优化调整,从而在复杂环境中持续学习和改进。

核心特征

特征说明
自主性无需人类干预,独立完成感知→规划→决策→行动
感知能力获取和理解环境信息(文本、图像、语音等)
推理与规划分析任务目标,分解为可执行的子步骤
行动能力调用外部工具影响环境
学习能力从经验中学习,优化自身行为

Agent vs 传统AI模型

对比维度传统AI模型Agent智能体
交互能力被动响应用户输入主动感知环境变化
决策模式基于概率预测基于目标导向的主动规划
执行能力仅生成文本/内容能够调用工具、访问外部系统
学习方式静态知识更新动态记忆积累和经验反思
任务处理单次对话完成支持多步骤、复杂任务序列
自主程度高度依赖人类指导具备一定程度的自主决策能力