第 2 章:核心概念:Agent 与模型
初次接触 Claude Code 时,最容易混淆的就是 Agent 和 模型 的关系。很多人以为"Claude Code 就是一个 AI 模型",这是一个根本性的误解。
理清这两个概念,是正确理解 Claude Code 工作方式的第一块基石。本章将带你建立这个最重要的心智模型。
2.1 Agent 是什么
Claude Code 是一个 Agent——它是一个软件框架/工具,而不是一个 AI 模型。
具体来说,Agent 负责以下五大职责:
- 对话管理:管理你和 AI 模型之间的多轮对话,追踪对话历史和上下文
- 工具调用:调用各种工具(读文件、写代码、执行命令、搜索网络等),并协调工具之间的配合
- 权限控制:决定何时需要你的确认、何时可以自主执行,保护你的系统安全
- 上下文维护:自动读取 CLAUDE.md、Memory、对话历史,构建完整的项目认知
- 模型调度:协调与底层 AI 模型的通信,支持在不同模型间切换
Agent 的架构总览
下面的架构图展示了 Claude Code Agent 的完整内部构造:
三大核心组件详解
Core Runtime(核心运行时) 是 Agent 的大脑中枢,负责:
- 对话/规划:理解你的意图,将复杂任务拆解为可执行的步骤
- 工具编排:决定在什么时机、以什么顺序调用哪些工具
- 权限与安全控制:根据配置决定哪些操作可以直接执行,哪些需要你的批准
- 上下文管理:自动读取项目中的 CLAUDE.md 和 Memory 文件,构建对项目的完整理解
- 会话管理:支持保存和恢复对话,让你可以中断后继续
Tool System(工具系统) 是 Agent 的"手和脚",提供了与外部世界交互的所有能力:
- 文件系统:读取、创建、编辑文件——这是 Agent 操作代码的基础
- 终端/Shell:执行任意命令行指令,运行构建脚本、测试、安装依赖等
- Git 集成:自动感知 Git 状态,执行 commit、diff、分支操作
- Web 搜索/获取:搜索互联网或获取特定 URL 的内容以获取最新信息
- MCP 服务器:通过 Model Context Protocol 接入外部数据源和服务
- 图像/PDF 读取:直接读取图片和 PDF 文档内容
Extension Ecosystem(扩展生态) 是 Agent 的可扩展性来源:
- Skills:可复用的指令模板和工作流,如代码审查、测试驱动开发等
- Plugins:通过 MCP 协议接入的社区/官方插件,扩展 Agent 的能力边界
- Hooks:事件驱动的自动化钩子,在特定时机自动触发动作
- 斜杠命令:以
/开头的快捷命令,如/clear、/compact等 - 键盘快捷键:可自定义的快捷键绑定,提升操作效率
关键认知:以上所有组件——Core Runtime、Tool System、Extension Ecosystem——都与使用哪个 AI 模型完全无关。无论底层接入的是 Claude Opus 还是 DeepSeek V4 Flash,Agent 的框架行为保持一致。
2.2 模型是什么
如果 Agent 是"身体",那么模型就是"大脑"。
模型(LLM,Large Language Model)是一个经过海量代码和文本训练的神经网络,它提供理解和生成代码的智能。Agent 将你的需求、项目上下文、工具调用结果打包发送给模型,模型经过"思考"后返回决策和代码,Agent 再根据这个决策去执行下一步操作。
当前可用的两大模型家族
在 Claude Code 中,你可以选择两大类模型:
Anthropic 官方模型:
| 模型 | 定位 | 特点 | 适用场景 | 总结 |
|---|---|---|---|---|
| Claude Opus 4.7 | 旗舰级 | 最强推理、最深理解、最准代码 | 复杂架构设计、深度调试、跨文件大规模重构 | 强 |
| Claude Sonnet 4.6 | 主力级 | 性能与速度的最佳平衡 | 日常编程、Bug 修复、功能开发(推荐默认使用) | 平衡型 |
| Claude Haiku 4.5 | 轻量级 | 最快响应、最低成本 | 简单查询、代码格式化、文档整理 | 快 |
DeepSeek 模型(通过 cc-switch 接入):
| 特性 | DeepSeek V4 Flash | DeepSeek V4 Pro |
|---|---|---|
| 定位 | 轻量快速、高吞吐 | 高性能、强推理 |
| 上下文 | 1M tokens | 1M tokens |
| 最大输出 | 384K tokens | 384K tokens |
| 思考模式 | 支持(默认开启) | 支持(默认开启) |
| 工具调用 | ✅ | ✅ |
| 并发限制 | 2,500 | 500 |
| OpenRouter 排名 | 2026 年 5 月登顶 | — |
定价对比
模型的成本差异巨大,选对模型可以大幅降低使用成本。以下是 2026 年 5 月的最新定价:
| 计费项(每 1M tokens) | DeepSeek V4 Flash | DeepSeek V4 Pro | Claude Sonnet 4.6 | Claude Opus 4.7 |
|---|---|---|---|---|
| 输入(缓存命中) | ¥0.02 | ¥0.025 ↓ | ¥1.05 | ¥10.50 |
| 输入(缓存未命中) | ¥1.00 | ¥3.00 ↓ | ¥21.00 | ¥105.00 |
| 输出 | ¥2.00 | ¥6.00 ↓ | ¥105.00 | ¥525.00 |
💡 DeepSeek V4 Flash 的输出价格仅为 Claude Sonnet 4.6 的 1/53,Claude Opus 4.7 的 1/263。V4 Pro 当前享受 75% 补贴价,2026/05/31 后调整为正式价:输入 ¥12.00,输出 ¥24.00(仍远低于 Anthropic 官方模型)。
从定价表可以直观看出:DeepSeek 的成本优势是数量级的。这使得"日常用便宜模型、关键任务用强模型"成为非常务实的策略。
2.3 Agent 与模型的分离关系
理解了 Agent 和模型各自是什么之后,最关键的问题是:它们之间是什么关系?
汽车与发动机的类比
一个简单而准确的类比:
Agent = 汽车(方向盘、油门、刹车、导航系统)
模型 = 发动机(提供动力)
换模型 ≈ 换发动机(同样的车,不同的马力)
Agent 的能力 ≠ 模型的智能(是两者的乘积)这个类比精确地描述了二者的关系:
- 方向盘、刹车、导航(Agent 的框架行为)不因发动机(模型)的改变而变化
- 但换了更强的发动机(更聪明的模型),整辆车的性能上限就更高
- 一台好车配一台弱发动机,或者一台强发动机配一台功能残缺的车,都不是最优解
三个核心原则
原则一:Agent 决定"能做什么"
Agent 决定了你能读什么文件、能执行哪些命令、能否搜索网络、何时需要你确认——这些都是 Agent 层面的事,与使用哪个模型无关。无论底层是 Opus 还是 Haiku,Agent 的工具列表、权限规则、MCP 服务器配置完全相同。
原则二:模型决定"做得有多好"
代码质量、逻辑推理深度、对复杂需求的理解——这些取决于模型能力。Opus 写的代码可能比 Haiku 更优雅、更健壮,但它们用的都是同一套工具(同一个 Agent)。就好像两个司机开同一辆车,技术好的司机会开得更稳更快。
原则三:你可以随时切换模型
通过 cc-switch,你可以在 Anthropic 官方模型和 DeepSeek 等第三方模型之间自由切换,Agent 的行为框架保持不变,但输出质量会随模型而变化。切换模型不需要重启 IDE,不需要修改项目配置——唯一改变的是"思考质量"和"价格"。
为什么这个区别很重要?
理解 Agent 和模型的分离,能帮你做出更好的排错和优化决策:
| 遇到什么问题 | 应该检查什么 | 不应该做什么 |
|---|---|---|
| Agent 行为出问题 | 检查 CLAUDE.md、对话状态、权限配置、工具调用日志 | 换模型(没用) |
| 改错了文件 | 检查上下文是否正确传递、CLAUDE.md 是否准确 | 切换到更贵的模型 |
| 输出质量出问题 | 切换到更强的模型(Sonnet → Opus) | 反复修改 Agent 配置 |
| 代码不够好、逻辑不严谨 | 升级模型,或调整 Effort 等级 | 怀疑是 Agent 的 Bug |
| 想省钱但质量不降 | 日常用 Haiku/DeepSeek Flash,复杂任务切 Opus | 一刀切全部用小模型 |
一句话总结:Agent 行为出问题 → 检查配置;输出质量出问题 → 切换模型。
2.4 Claude 模型家族
Anthropic 提供的三个模型构成了一个完整的能力阶梯。理解每个模型的定位,是高效使用 Claude Code 的关键。
Claude Opus 4.7 —— 旗舰级
Opus 是 Anthropic 的最强模型,在推理深度、代码质量、复杂理解方面处于最高水平。
适用场景:
- 复杂架构设计:需要从零设计系统结构,涉及多个模块和层次
- 深度调试:难以复现的 Bug,需要从大量日志和代码中推理出根因
- 跨文件大规模重构:涉及几十个文件的重构,需要全局理解依赖关系
- 安全审计:需要逐行分析代码中的潜在安全漏洞
选择时机: 当你把一个任务交给 Sonnet,它的输出让你感到"不够好"的时候,就是该切 Opus 的信号。
Claude Sonnet 4.6 —— 主力级
Sonnet 是 Anthropic 推荐的默认模型,在性能和速度之间取得了最佳平衡。对于 80% 的日常开发任务,Sonnet 的表现已经足够好。
适用场景:
- 日常功能开发:CRUD、业务逻辑、API 实现
- Bug 修复:常见逻辑错误、类型错误、边界条件处理
- 代码审查:在 PR Review 中识别代码质量问题
- 测试编写:为已有代码补充单元测试和集成测试
选择时机: 作为默认选择。只用在你明确感到"需要更强推理"时才升级到 Opus,或在你需要"更快更便宜"时降级到 Haiku。
Claude Haiku 4.5 —— 轻量级
Haiku 是速度最快、成本最低的选择。虽然推理能力不如前两者,但在简单任务上完全胜任。
适用场景:
- 简单查询:问某个函数的用法、查 API 文档
- 代码格式化:统一代码风格、调整缩进
- 文档整理:格式化 Markdown、整理注释
- 快速草稿:生成一些简单的样板代码
选择时机: 当你明确知道自己要什么,只需要 AI 帮你"执行"而非"思考"的时候。
三者关系
Opus ←→ Sonnet ←→ Haiku
强/慢/贵 平衡 快/便宜/弱
三者使用完全相同的 Agent 框架和工具系统
唯一区别:推理能力、响应速度、使用成本2.5 DeepSeek 模型家族
DeepSeek 是深度求索(DeepSeek)开发的 AI 模型系列,其 API 通过 Anthropic 兼容格式提供服务。配合 cc-switch,可将 Claude Code 的底层模型替换为 DeepSeek,在保留 Claude Code Agent 全部框架能力(工具编排、文件操作、权限控制等)的同时,使用 DeepSeek 的推理能力。
DeepSeek 开放平台:https://platform.deepseek.com/
V4 系列概览
2026 年 4 月发布的 V4 系列包含两个模型,覆盖了从日常开发到复杂推理的全场景:
| 维度 | DeepSeek V4 Flash | DeepSeek V4 Pro |
|---|---|---|
| 定位 | 轻量快速、高吞吐、极致性价比 | 高性能、强推理、接近旗舰水平 |
| 最适合 | 日常开发、批量任务、高频调用 | 复杂逻辑、架构推理、高质量输出 |
| 上下文 | 1M tokens | 1M tokens |
| 最大输出 | 384K tokens | 384K tokens |
| 思考模式 | 支持(默认开启) | 支持(默认开启) |
| 并发限制 | 2,500 | 500 |
| 价格特点 | 极低,输出仅 ¥2/1M tokens | 75% 补贴中,性价比极高 |
定价竞争力
2026 年 5 月,DeepSeek 宣布 永久降价 75%,使得 V4 系列的价格优势达到数量级:
DeepSeek V4 Flash 输出: ¥2/1M tokens
Claude Opus 4.7 输出: ¥525/1M tokens
价格差距: 263 倍这意味着:用同样的预算,你可以让 DeepSeek V4 Flash 处理 263 倍的工作量——或者用省下的钱,在关键任务上毫不犹豫地切换到 Opus。
Anthropic 兼容接口
DeepSeek 提供了与 Anthropic API 兼容的端点:
https://api.deepseek.com/anthropic这意味着 Claude Code 可以使用 DeepSeek 模型而不需要任何适配层或中间件。Claude Code 发出的 API 请求格式与 Anthropic 原生格式兼容,DeepSeek 的服务端直接响应。
详细配置方式见第 3 章「环境搭建」。
模型选择建议
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 日常开发、简单重构 | DeepSeek V4 Flash | 极低成本,足够好的代码能力 |
| 复杂架构设计、深度推理 | Claude Opus 4.7 | 推理深度不可替代 |
| 高质量代码生成 | DeepSeek V4 Pro / Claude Sonnet 4.6 | 两者各有所长,视具体任务选择 |
| 高频调用、批量处理 | DeepSeek V4 Flash | 2500 并发 + 极低缓存价格,适合规模化 |
2.6 什么时候用哪个模型:决策框架
面对五个可选模型(Opus 4.7、Sonnet 4.6、Haiku 4.5、V4 Pro、V4 Flash),如何快速做出选择?下面提供一个实用的决策框架。
决策树
你的任务是什么?
│
├─ 简单操作(格式化、查文档、简单问答)
│ └─ → Haiku 4.5 或 V4 Flash
│ ├─ 追求最快响应 → Haiku 4.5
│ └─ 追求最低成本 → V4 Flash
│
├─ 日常开发(CRUD、Bug修复、功能实现、测试编写)
│ └─ → Sonnet 4.6 或 V4 Flash
│ ├─ 质量优先、团队协作 → Sonnet 4.6(默认推荐)
│ └─ 成本优先、个人项目 → V4 Flash
│
├─ 复杂任务(架构设计、深度调试、安全审计)
│ └─ → Opus 4.7 或 V4 Pro
│ ├─ 推理深度不可妥协 → Opus 4.7
│ └─ 预算有限但需要强推理 → V4 Pro
│
└─ 混合场景(一个项目中有简单也有复杂的任务)
└─ → 动态切换策略
├─ 默认使用 Sonnet/V4 Flash 处理大多数任务
├─ 遇到复杂逻辑时临时切到 Opus/V4 Pro
└─ 完成复杂部分后切回默认模型决策矩阵
| 维度 | Opus 4.7 | Sonnet 4.6 | Haiku 4.5 | V4 Pro | V4 Flash |
|---|---|---|---|---|---|
| 推理深度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| 响应速度 | ⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 代码质量 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| 成本 | ¥525/1M 输出 | ¥105/1M 输出 | ¥15.75/1M 输出 | ¥6/1M 输出 | ¥2/1M 输出 |
| 性价比 | 低(绝对质量优先) | 中 | 高 | 极高(补贴期) | 极高 |
| 推荐任务量 | 少量关键任务 | 主力日常 | 大量简单任务 | 复杂但预算敏感 | 高频批量 |
实用经验法则
- 默认使用 Sonnet 或 V4 Flash:80% 的日常开发任务交给它们,不要一上来就用 Opus
- Sonnet 不满足时再切 Opus:这是一个明确的信号——当你觉得 Sonnet 的输出"差一点意思"时,就是 Opus 的用武之地
- 明确知道要什么就用 Haiku 或 V4 Flash:不需要推理的任务不要浪费强模型
- 高频调用无脑选 V4 Flash:2500 并发 + 极低价格,批量任务的最佳选择
- 预算无限?仍然建议分场景选模型:不是越贵越好,响应速度也是体验的一部分。等 30 秒的 Opus 回复 vs 3 秒的 Haiku 回复,对简单问题来说体验差距显著
- 双账号策略:配置 Anthropic 和 DeepSeek 两个账号,通过 cc-switch 一键切换,兼顾质量与成本
一个典型的日常使用模式
早上开始工作 → 切到 Sonnet(默认主力)
写 CRUD 接口、改 Bug → Sonnet 足够
遇到一个诡异的并发 Bug → 切到 Opus 深度分析
分析完毕,开始修 → 切回 Sonnet
批量格式化 50 个文件 → 切到 V4 Flash(快 + 便宜)
Code Review 团队的 PR → Sonnet这个模式的核心是:根据任务性质动态选择,不做一刀切。掌握这个决策框架,你就能在质量、速度、成本三者之间找到最优平衡点。
本章小结
- Claude Code 是一个 Agent(软件框架),不是 AI 模型。它负责对话管理、工具调用、权限控制、上下文维护和模型调度
- 模型是 Agent 的大脑,提供理解和生成代码的智能。Agent 和模型是分离的,可以独立替换
- Agent 决定"能做什么",模型决定"做得有多好":行为问题检查配置,质量问题切换模型
- 五大模型构成完整的能力阶梯:Opus(最强)→ Sonnet(平衡)→ Haiku(最快)→ V4 Pro(性价比高)→ V4 Flash(极致性价比)
- DeepSeek 的成本优势是数量级的:V4 Flash 输出价格仅为 Opus 的 1/263
- 动态选择模型是高效使用 Claude Code 的核心技能:根据任务性质在质量、速度、成本之间找平衡