Skip to content
Published at:

第 2 章:核心概念:Agent 与模型

初次接触 Claude Code 时,最容易混淆的就是 Agent模型 的关系。很多人以为"Claude Code 就是一个 AI 模型",这是一个根本性的误解。

理清这两个概念,是正确理解 Claude Code 工作方式的第一块基石。本章将带你建立这个最重要的心智模型。

2.1 Agent 是什么

Claude Code 是一个 Agent——它是一个软件框架/工具,而不是一个 AI 模型。

具体来说,Agent 负责以下五大职责:

  1. 对话管理:管理你和 AI 模型之间的多轮对话,追踪对话历史和上下文
  2. 工具调用:调用各种工具(读文件、写代码、执行命令、搜索网络等),并协调工具之间的配合
  3. 权限控制:决定何时需要你的确认、何时可以自主执行,保护你的系统安全
  4. 上下文维护:自动读取 CLAUDE.md、Memory、对话历史,构建完整的项目认知
  5. 模型调度:协调与底层 AI 模型的通信,支持在不同模型间切换

Agent 的架构总览

下面的架构图展示了 Claude Code Agent 的完整内部构造:

flowchart TB subgraph SHELLS["🖥️ Shell / Client Layer(使用界面)"] direction TB E1["📟 CLI<br>(终端命令行)"] E2["🌐 Web UI<br>(claude.ai/code)"] E3["💻 VSCode 扩展<br>(推荐)"] E4["🧩 JetBrains 插件<br>(IntelliJ/PyCharm)"] E5["🖲️ Desktop App<br>(独立应用)"] end SHELLS --> AGENT subgraph AGENT["Claude Code(Agent)"] direction LR subgraph CORE["🧠 Core Runtime"] direction TB A1["对话 / 规划"] A2["工具编排"] A3["权限与安全控制"] A4["上下文管理<br>(CLAUDE.md / Memory)"] A5["会话管理<br>(Save / Resume)"] end subgraph TOOLS["🔧 工具系统"] direction TB B1["文件系统"] B2["终端 / Shell"] B3["Git 集成"] B4["Web 搜索 / 获取"] B5["MCP 服务器"] B6["网络请求"] B7["图像 / PDF 读取"] end subgraph EXT["🧩 扩展生态"] direction TB C1["Skills<br>(技能 / 工作流)"] C2["Plugins<br>(MCP 插件)"] C3["Hooks<br>(事件钩子)"] C4["斜杠命令<br>(/help 等)"] C5["键盘快捷键<br>(Keymap)"] end end AGENT --> API["调用模型 API"] subgraph MODELS["🤖 模型层"] direction TB subgraph OFFICIAL["Anthropic 官方模型"] D1["Claude Opus 4.7"] D2["Claude Sonnet 4.6"] D3["Claude Haiku 4.5"] end D4["第三方模型<br>(DeepSeek / OpenAI 等)"] end API --> OFFICIAL API -. 通过 cc-switch 接入 .-> D4

三大核心组件详解

Core Runtime(核心运行时) 是 Agent 的大脑中枢,负责:

  • 对话/规划:理解你的意图,将复杂任务拆解为可执行的步骤
  • 工具编排:决定在什么时机、以什么顺序调用哪些工具
  • 权限与安全控制:根据配置决定哪些操作可以直接执行,哪些需要你的批准
  • 上下文管理:自动读取项目中的 CLAUDE.md 和 Memory 文件,构建对项目的完整理解
  • 会话管理:支持保存和恢复对话,让你可以中断后继续

Tool System(工具系统) 是 Agent 的"手和脚",提供了与外部世界交互的所有能力:

  • 文件系统:读取、创建、编辑文件——这是 Agent 操作代码的基础
  • 终端/Shell:执行任意命令行指令,运行构建脚本、测试、安装依赖等
  • Git 集成:自动感知 Git 状态,执行 commit、diff、分支操作
  • Web 搜索/获取:搜索互联网或获取特定 URL 的内容以获取最新信息
  • MCP 服务器:通过 Model Context Protocol 接入外部数据源和服务
  • 图像/PDF 读取:直接读取图片和 PDF 文档内容

Extension Ecosystem(扩展生态) 是 Agent 的可扩展性来源:

  • Skills:可复用的指令模板和工作流,如代码审查、测试驱动开发等
  • Plugins:通过 MCP 协议接入的社区/官方插件,扩展 Agent 的能力边界
  • Hooks:事件驱动的自动化钩子,在特定时机自动触发动作
  • 斜杠命令:以 / 开头的快捷命令,如 /clear/compact
  • 键盘快捷键:可自定义的快捷键绑定,提升操作效率

关键认知:以上所有组件——Core Runtime、Tool System、Extension Ecosystem——都与使用哪个 AI 模型完全无关。无论底层接入的是 Claude Opus 还是 DeepSeek V4 Flash,Agent 的框架行为保持一致。

2.2 模型是什么

如果 Agent 是"身体",那么模型就是"大脑"

模型(LLM,Large Language Model)是一个经过海量代码和文本训练的神经网络,它提供理解和生成代码的智能。Agent 将你的需求、项目上下文、工具调用结果打包发送给模型,模型经过"思考"后返回决策和代码,Agent 再根据这个决策去执行下一步操作。

当前可用的两大模型家族

在 Claude Code 中,你可以选择两大类模型:

Anthropic 官方模型:

模型定位特点适用场景总结
Claude Opus 4.7旗舰级最强推理、最深理解、最准代码复杂架构设计、深度调试、跨文件大规模重构
Claude Sonnet 4.6主力级性能与速度的最佳平衡日常编程、Bug 修复、功能开发(推荐默认使用)平衡型
Claude Haiku 4.5轻量级最快响应、最低成本简单查询、代码格式化、文档整理

DeepSeek 模型(通过 cc-switch 接入):

特性DeepSeek V4 FlashDeepSeek V4 Pro
定位轻量快速、高吞吐高性能、强推理
上下文1M tokens1M tokens
最大输出384K tokens384K tokens
思考模式支持(默认开启)支持(默认开启)
工具调用
并发限制2,500500
OpenRouter 排名2026 年 5 月登顶

定价对比

模型的成本差异巨大,选对模型可以大幅降低使用成本。以下是 2026 年 5 月的最新定价:

计费项(每 1M tokens)DeepSeek V4 FlashDeepSeek V4 ProClaude Sonnet 4.6Claude Opus 4.7
输入(缓存命中)¥0.02¥0.025 ↓¥1.05¥10.50
输入(缓存未命中)¥1.00¥3.00 ↓¥21.00¥105.00
输出¥2.00¥6.00 ↓¥105.00¥525.00

💡 DeepSeek V4 Flash 的输出价格仅为 Claude Sonnet 4.6 的 1/53,Claude Opus 4.7 的 1/263。V4 Pro 当前享受 75% 补贴价,2026/05/31 后调整为正式价:输入 ¥12.00,输出 ¥24.00(仍远低于 Anthropic 官方模型)。

从定价表可以直观看出:DeepSeek 的成本优势是数量级的。这使得"日常用便宜模型、关键任务用强模型"成为非常务实的策略。

2.3 Agent 与模型的分离关系

理解了 Agent 和模型各自是什么之后,最关键的问题是:它们之间是什么关系?

汽车与发动机的类比

一个简单而准确的类比:

Agent = 汽车(方向盘、油门、刹车、导航系统)
模型  = 发动机(提供动力)

换模型 ≈ 换发动机(同样的车,不同的马力)
Agent 的能力 ≠ 模型的智能(是两者的乘积)

这个类比精确地描述了二者的关系:

  • 方向盘、刹车、导航(Agent 的框架行为)不因发动机(模型)的改变而变化
  • 但换了更强的发动机(更聪明的模型),整辆车的性能上限就更高
  • 一台好车配一台弱发动机,或者一台强发动机配一台功能残缺的车,都不是最优解

三个核心原则

原则一:Agent 决定"能做什么"

Agent 决定了你能读什么文件、能执行哪些命令、能否搜索网络、何时需要你确认——这些都是 Agent 层面的事,与使用哪个模型无关。无论底层是 Opus 还是 Haiku,Agent 的工具列表、权限规则、MCP 服务器配置完全相同。

原则二:模型决定"做得有多好"

代码质量、逻辑推理深度、对复杂需求的理解——这些取决于模型能力。Opus 写的代码可能比 Haiku 更优雅、更健壮,但它们用的都是同一套工具(同一个 Agent)。就好像两个司机开同一辆车,技术好的司机会开得更稳更快。

原则三:你可以随时切换模型

通过 cc-switch,你可以在 Anthropic 官方模型和 DeepSeek 等第三方模型之间自由切换,Agent 的行为框架保持不变,但输出质量会随模型而变化。切换模型不需要重启 IDE,不需要修改项目配置——唯一改变的是"思考质量"和"价格"。

为什么这个区别很重要?

理解 Agent 和模型的分离,能帮你做出更好的排错和优化决策:

遇到什么问题应该检查什么不应该做什么
Agent 行为出问题检查 CLAUDE.md、对话状态、权限配置、工具调用日志换模型(没用)
改错了文件检查上下文是否正确传递、CLAUDE.md 是否准确切换到更贵的模型
输出质量出问题切换到更强的模型(Sonnet → Opus)反复修改 Agent 配置
代码不够好、逻辑不严谨升级模型,或调整 Effort 等级怀疑是 Agent 的 Bug
想省钱但质量不降日常用 Haiku/DeepSeek Flash,复杂任务切 Opus一刀切全部用小模型

一句话总结:Agent 行为出问题 → 检查配置;输出质量出问题 → 切换模型。

2.4 Claude 模型家族

Anthropic 提供的三个模型构成了一个完整的能力阶梯。理解每个模型的定位,是高效使用 Claude Code 的关键。

Claude Opus 4.7 —— 旗舰级

Opus 是 Anthropic 的最强模型,在推理深度、代码质量、复杂理解方面处于最高水平。

适用场景:

  • 复杂架构设计:需要从零设计系统结构,涉及多个模块和层次
  • 深度调试:难以复现的 Bug,需要从大量日志和代码中推理出根因
  • 跨文件大规模重构:涉及几十个文件的重构,需要全局理解依赖关系
  • 安全审计:需要逐行分析代码中的潜在安全漏洞

选择时机: 当你把一个任务交给 Sonnet,它的输出让你感到"不够好"的时候,就是该切 Opus 的信号。

Claude Sonnet 4.6 —— 主力级

Sonnet 是 Anthropic 推荐的默认模型,在性能和速度之间取得了最佳平衡。对于 80% 的日常开发任务,Sonnet 的表现已经足够好。

适用场景:

  • 日常功能开发:CRUD、业务逻辑、API 实现
  • Bug 修复:常见逻辑错误、类型错误、边界条件处理
  • 代码审查:在 PR Review 中识别代码质量问题
  • 测试编写:为已有代码补充单元测试和集成测试

选择时机: 作为默认选择。只用在你明确感到"需要更强推理"时才升级到 Opus,或在你需要"更快更便宜"时降级到 Haiku。

Claude Haiku 4.5 —— 轻量级

Haiku 是速度最快、成本最低的选择。虽然推理能力不如前两者,但在简单任务上完全胜任。

适用场景:

  • 简单查询:问某个函数的用法、查 API 文档
  • 代码格式化:统一代码风格、调整缩进
  • 文档整理:格式化 Markdown、整理注释
  • 快速草稿:生成一些简单的样板代码

选择时机: 当你明确知道自己要什么,只需要 AI 帮你"执行"而非"思考"的时候。

三者关系

Opus  ←→  Sonnet  ←→  Haiku
  强/慢/贵          平衡             快/便宜/弱

三者使用完全相同的 Agent 框架和工具系统
唯一区别:推理能力、响应速度、使用成本

2.5 DeepSeek 模型家族

DeepSeek 是深度求索(DeepSeek)开发的 AI 模型系列,其 API 通过 Anthropic 兼容格式提供服务。配合 cc-switch,可将 Claude Code 的底层模型替换为 DeepSeek,在保留 Claude Code Agent 全部框架能力(工具编排、文件操作、权限控制等)的同时,使用 DeepSeek 的推理能力。

DeepSeek 开放平台:https://platform.deepseek.com/

V4 系列概览

2026 年 4 月发布的 V4 系列包含两个模型,覆盖了从日常开发到复杂推理的全场景:

维度DeepSeek V4 FlashDeepSeek V4 Pro
定位轻量快速、高吞吐、极致性价比高性能、强推理、接近旗舰水平
最适合日常开发、批量任务、高频调用复杂逻辑、架构推理、高质量输出
上下文1M tokens1M tokens
最大输出384K tokens384K tokens
思考模式支持(默认开启)支持(默认开启)
并发限制2,500500
价格特点极低,输出仅 ¥2/1M tokens75% 补贴中,性价比极高

定价竞争力

2026 年 5 月,DeepSeek 宣布 永久降价 75%,使得 V4 系列的价格优势达到数量级:

DeepSeek V4 Flash 输出: ¥2/1M tokens
Claude Opus 4.7 输出:  ¥525/1M tokens

价格差距: 263 倍

这意味着:用同样的预算,你可以让 DeepSeek V4 Flash 处理 263 倍的工作量——或者用省下的钱,在关键任务上毫不犹豫地切换到 Opus。

Anthropic 兼容接口

DeepSeek 提供了与 Anthropic API 兼容的端点:

https://api.deepseek.com/anthropic

这意味着 Claude Code 可以使用 DeepSeek 模型而不需要任何适配层或中间件。Claude Code 发出的 API 请求格式与 Anthropic 原生格式兼容,DeepSeek 的服务端直接响应。

详细配置方式见第 3 章「环境搭建」。

模型选择建议

场景推荐模型理由
日常开发、简单重构DeepSeek V4 Flash极低成本,足够好的代码能力
复杂架构设计、深度推理Claude Opus 4.7推理深度不可替代
高质量代码生成DeepSeek V4 Pro / Claude Sonnet 4.6两者各有所长,视具体任务选择
高频调用、批量处理DeepSeek V4 Flash2500 并发 + 极低缓存价格,适合规模化

2.6 什么时候用哪个模型:决策框架

面对五个可选模型(Opus 4.7、Sonnet 4.6、Haiku 4.5、V4 Pro、V4 Flash),如何快速做出选择?下面提供一个实用的决策框架。

决策树

你的任务是什么?

├─ 简单操作(格式化、查文档、简单问答)
│  └─ → Haiku 4.5 或 V4 Flash
│      ├─ 追求最快响应 → Haiku 4.5
│      └─ 追求最低成本 → V4 Flash

├─ 日常开发(CRUD、Bug修复、功能实现、测试编写)
│  └─ → Sonnet 4.6 或 V4 Flash
│      ├─ 质量优先、团队协作 → Sonnet 4.6(默认推荐)
│      └─ 成本优先、个人项目 → V4 Flash

├─ 复杂任务(架构设计、深度调试、安全审计)
│  └─ → Opus 4.7 或 V4 Pro
│      ├─ 推理深度不可妥协 → Opus 4.7
│      └─ 预算有限但需要强推理 → V4 Pro

└─ 混合场景(一个项目中有简单也有复杂的任务)
   └─ → 动态切换策略
       ├─ 默认使用 Sonnet/V4 Flash 处理大多数任务
       ├─ 遇到复杂逻辑时临时切到 Opus/V4 Pro
       └─ 完成复杂部分后切回默认模型

决策矩阵

维度Opus 4.7Sonnet 4.6Haiku 4.5V4 ProV4 Flash
推理深度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
响应速度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
代码质量⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
成本¥525/1M 输出¥105/1M 输出¥15.75/1M 输出¥6/1M 输出¥2/1M 输出
性价比低(绝对质量优先)极高(补贴期)极高
推荐任务量少量关键任务主力日常大量简单任务复杂但预算敏感高频批量

实用经验法则

  1. 默认使用 Sonnet 或 V4 Flash:80% 的日常开发任务交给它们,不要一上来就用 Opus
  2. Sonnet 不满足时再切 Opus:这是一个明确的信号——当你觉得 Sonnet 的输出"差一点意思"时,就是 Opus 的用武之地
  3. 明确知道要什么就用 Haiku 或 V4 Flash:不需要推理的任务不要浪费强模型
  4. 高频调用无脑选 V4 Flash:2500 并发 + 极低价格,批量任务的最佳选择
  5. 预算无限?仍然建议分场景选模型:不是越贵越好,响应速度也是体验的一部分。等 30 秒的 Opus 回复 vs 3 秒的 Haiku 回复,对简单问题来说体验差距显著
  6. 双账号策略:配置 Anthropic 和 DeepSeek 两个账号,通过 cc-switch 一键切换,兼顾质量与成本

一个典型的日常使用模式

早上开始工作 → 切到 Sonnet(默认主力)
写 CRUD 接口、改 Bug → Sonnet 足够
遇到一个诡异的并发 Bug → 切到 Opus 深度分析
分析完毕,开始修 → 切回 Sonnet
批量格式化 50 个文件 → 切到 V4 Flash(快 + 便宜)
Code Review 团队的 PR → Sonnet

这个模式的核心是:根据任务性质动态选择,不做一刀切。掌握这个决策框架,你就能在质量、速度、成本三者之间找到最优平衡点。


本章小结

  • Claude Code 是一个 Agent(软件框架),不是 AI 模型。它负责对话管理、工具调用、权限控制、上下文维护和模型调度
  • 模型是 Agent 的大脑,提供理解和生成代码的智能。Agent 和模型是分离的,可以独立替换
  • Agent 决定"能做什么",模型决定"做得有多好":行为问题检查配置,质量问题切换模型
  • 五大模型构成完整的能力阶梯:Opus(最强)→ Sonnet(平衡)→ Haiku(最快)→ V4 Pro(性价比高)→ V4 Flash(极致性价比)
  • DeepSeek 的成本优势是数量级的:V4 Flash 输出价格仅为 Opus 的 1/263
  • 动态选择模型是高效使用 Claude Code 的核心技能:根据任务性质在质量、速度、成本之间找平衡