Agent 核心概念

什么是 Agent

Agent（智能体） 是一种以大语言模型（LLM）为"大脑"，能够自主感知环境、进行推理规划，并调用外部工具执行复杂任务的系统。

LLM（大模型） = 大脑（项目经理）→ 负责思考、规划、决定下一步做什么
Tools（工具） = 手脚（执行专员）→ 负责执行具体操作
Agent = 大脑 + 手脚 + 循环机制 → 不断"思考-行动-观察"来解决问题

Agent的本质可以被理解为一种高级的提示工程（Prompt Engineering）应用范式，开发者通过精心设计的提示词模板，引导LLM模仿人类的思考与执行方式，使其能够自主地分解任务、选择工具、调用工具并整合结果，最终完成复杂的任务。

┌─────────────────────────────────────────────────────────┐
│                    Agent 智能体                          │
├─────────────────────────────────────────────────────────┤
│  感知模块 (Perception)  →  接收文本、图像、语音输入      │
│         ↓                                               │
│  认知中枢 (Brain)       →  LLM 推理 + RAG 检索          │
│         ↓                                               │
│  记忆系统 (Memory)      →  短期记忆 + 长期记忆           │
│         ↓                                               │
│  工具生态 (Tools)       →  API调用、数据库访问           │
│         ↓                                               │
│  执行引擎 (Action)      →  执行任务并反馈结果            │
└─────────────────────────────────────────────────────────┘

环境感知 → 任务规划 → 工具调用 → 执行反馈 → 自我反思 → 优化调整，从而在复杂环境中持续学习和改进。

核心特征

特征	说明
自主性	无需人类干预，独立完成感知→规划→决策→行动
感知能力	获取和理解环境信息（文本、图像、语音等）
推理与规划	分析任务目标，分解为可执行的子步骤
行动能力	调用外部工具影响环境
学习能力	从经验中学习，优化自身行为

Agent vs 传统AI模型

对比维度	传统AI模型	Agent智能体
交互能力	被动响应用户输入	主动感知环境变化
决策模式	基于概率预测	基于目标导向的主动规划
执行能力	仅生成文本/内容	能够调用工具、访问外部系统
学习方式	静态知识更新	动态记忆积累和经验反思
任务处理	单次对话完成	支持多步骤、复杂任务序列
自主程度	高度依赖人类指导	具备一定程度的自主决策能力

什么是 Agent​

核心特征​

Agent vs 传统AI模型​

什么是 Agent

核心特征

Agent vs 传统AI模型