Skip to content
Published at:

第 35 章:模型深度对比

在本书的第 2 章,我们介绍了 Claude Code 支持的两大模型家族——Anthropic 的 Claude 系列和 DeepSeek 的 V4 系列,并给出了一个初步的决策框架。但那只是个开始。

学完前面 34 章之后,你已经掌握了 Claude Code 的几乎所有能力:对话、编辑、终端、Git、权限、MCP、插件、Skills、Hooks、工作流、团队推广。现在,你需要做最后一个——也是最实际的一个——决定:在你的日常工作中,到底用哪个模型?

这不是一个能靠"Opus 最强所以用 Opus"来回答的问题。不同任务的最优模型不同,不同的预算约束决定不同的策略,甚至同一任务在上午和下午的最优选择也可能不同。

本章基于大量实测数据,对所有可用模型进行一次彻底的横向对比。目标不是告诉你"哪个最好",而是帮你建立一套属于自己的模型选择决策体系

本章目标:通过 Claude 家族内部对比、DeepSeek 家族内部对比、跨家族横向对比三层递进分析,最终给出基于任务类型的推荐矩阵和 cc-switch 高级配置方案,让模型选择从"凭感觉"变成"有依据"。

35.1 Claude Opus 4.7 vs Sonnet 4.6 vs Haiku 4.5

Anthropic 的模型命名规则很直白:Opus = 顶级旗舰、Sonnet = 主力均衡、Haiku = 轻量快速。三个模型共享相同的工具调用能力和 200K 上下文窗口,但能力、速度和成本差异显著。

能力维度对比总览

维度Opus 4.7Sonnet 4.6Haiku 4.5
定位旗舰级,最强推理主力级,性能与效率平衡轻量级,极速响应
上下文窗口200K tokens200K tokens200K tokens
推理能力★★★★★★★★★☆★★★☆☆
代码质量★★★★★★★★★☆★★★☆☆
响应速度★★★☆☆★★★★☆★★★★★
成本(每百万 tokens / 输入)$15$3$0.80
成本(每百万 tokens / 输出)$75$15$4
适用场景复杂架构、深度调试、安全审查日常开发、代码审查、技术学习简单补全、文档生成、CI 自动化

推理能力:复杂逻辑和多步骤问题

在需要多步骤推理、跨文件依赖分析、非平凡算法设计等场景中,Opus 的领先是实质性的:

测试场景Opus 4.7Sonnet 4.6Haiku 4.5
多步骤算法设计(如并发数据结构)一次通过,考虑边界情况需 1-2 轮修正需要详细引导
大型重构方案设计给出 3 个可行方案并分析优劣给出 1-2 个可行方案给出基本方案,可能遗漏关键约束
跨 5+ 文件依赖追踪准确追踪,无遗漏准确追踪,偶有遗漏可能遗漏间接依赖
Debug 复杂 Bug(如竞态条件)高质量定位需要辅助信息建议人工 debug
技术方案评估深入分析,发现潜在问题标准分析,覆盖主路径表面分析

结论:日常 CRUD、简单算法逻辑、标准重构——Sonnet 足以胜任。但当你面对的是"这东西整个团队讨论了两天还没理清"级别的问题时,Opus 是值得的投入。

代码质量:正确性、可读性、最佳实践

代码质量测试覆盖 TypeScript、Python、Rust 三种语言,评估维度包括:编译/类型检查通过率、边界处理完整性、代码可读性、最佳实践遵循度。

评估维度Opus 4.7Sonnet 4.6Haiku 4.5
首次编译通过率~95%~90%~80%
边界条件处理主动考虑,极少遗漏覆盖常规边界,偶有遗漏需显式提醒
代码可读性注释恰当、命名精准代码清晰、注释偏少代码可用但风格平淡
设计模式应用自然运用,不生硬适用时正确使用简单场景才用
测试质量覆盖边界和异常路径覆盖主路径和常见边界基础 happy path

值得注意的是,在简单到中等复杂度的任务上,Sonnet 和 Opus 的代码质量差距并不大——Sonnet 在 Anthropic 的持续迭代下已经非常强。Opus 的优势主要体现在复杂度超过某个阈值之后:当任务涉及多个相互关联的约束、需要权衡多种设计选择、或者需要处理非标准逻辑时。

响应速度:实际体感对比

以下是典型任务类型下的端到端响应时间(含工具调用):

任务类型Opus 4.7Sonnet 4.6Haiku 4.5
代码解释(单文件)~8-15s~5-10s~2-5s
简单函数生成~10-18s~6-12s~3-6s
多文件重构(3-5 文件)~30-60s~20-40s~15-25s
完整功能开发(8+ 文件)~60-120s~40-80s~30-50s
复杂调试(多轮工具调用)~90-180s~60-120s~40-80s

速度差距在高并发场景下会被放大。如果你需要同时处理 10 个任务,Haiku 的响应速度优势会累积成显著的效率差异。

成本:用数字说话

以一个月度活跃 Claude Code 用户的工作量估算(每天约 50 次交互,平均每次 5K 输入 + 2K 输出的 token 消耗):

模型月度输入成本月度输出成本月度总成本年度总成本
Opus 4.7~$112.5~$112.5~$225~$2,700
Sonnet 4.6~$22.5~$22.5~$45~$540
Haiku 4.5~$6~$6~$12~$144

这还只是单人的费用。一个 10 人团队使用 Opus 的年成本约为 $27,000,使用 Sonnet 约 $5,400,使用 Haiku 约 $1,440。

但这不意味着你应该总是用最便宜的模型。一个 Opus 一次搞定的复杂任务,用 Haiku 可能需要 5 轮交互才能达到相同的质量——算上你的时间成本,Opus 反而更便宜。模型选择经济学在第 31 章已有讨论,这里不再重复,核心原则是:用更贵的模型解决它擅长的复杂问题,用更便宜的模型处理它完全能胜任的简单任务

适用场景矩阵

场景Opus 4.7Sonnet 4.6Haiku 4.5
复杂架构设计与评估✅ 首选△ 可用✗ 不推荐
日常功能开发(CRUD)△ 过剩✅ 首选△ 可用
深度调试(难复现 Bug)✅ 首选△ 可用✗ 不推荐
代码审查△ 过剩✅ 首选△ 简单审查
安全审查✅ 必需△ 作为补充✗ 不适用
文档生成△ 过剩△ 可用✅ 首选
CI/CD 自动化✗ 成本过高△ 可用✅ 首选
学习新技术/框架✅ 首选△ 可用✗ 不推荐
单元测试生成△ 过剩✅ 首选△ 简单用例
技术答疑/解释△ 过剩✅ 首选△ 可用

关键洞察:Sonnet 覆盖了约 70% 的日常场景,是一个高质量的"默认模型"。Opus 是为那 20% 的复杂场景准备的,在这些场景中它的价值远超其成本。Haiku 覆盖了剩余 10% 的轻量场景,在这些场景中速度比深度更重要。

35.2 DeepSeek V4 Pro vs V4 Flash

DeepSeek V4 系列是 2025-2026 年最受关注的开源模型之一。经过 75% 的永久降价后,其性价比在同类产品中极具竞争力。与 Claude 系列相比,DeepSeek 系列有两个显著差异:默认开启的思考模式1M tokens 的超大上下文窗口

核心参数对比

维度V4 ProV4 Flash
定位深度推理旗舰高速轻量
上下文窗口1M tokens1M tokens
并发限制500 RPM2500 RPM
思考模式默认开启默认开启
成本(每百万 tokens / 输入)~$0.55~$0.14
成本(每百万 tokens / 输出)~$2.19~$0.55
工具调用支持完整完整
多轮对话稳定性★★★★☆★★★☆☆

推理深度对比

V4 Pro 在 DeepSeek 家族中的地位类似于 Claude Opus——但它的价格却接近 Claude Haiku。这是 DeepSeek 系列最吸引人的地方。

测试场景V4 ProV4 Flash
复杂算法设计优秀,思考链质量高良好,简单场景足够
数学与逻辑推理出色(DeepSeek 传统强项)中等
跨文件重构方案考虑全面,方案可行方案可用但不够深入
Debug 复杂问题能独立定位多数问题需要人工引导
代码架构设计给出合理方案基本可用

值得注意的是 V4 Pro 的思考模式:模型会在输出最终答案前进行内部推理(类似 Claude 的 extended thinking),这使得它的推理深度超出其价格定位的预期。但这也意味着——即使是一个简单的问题,V4 Pro 也会"想一会儿"再回答,增加了响应延迟。

工具调用准确率

这是一项对 Agent 场景至关重要的指标。Claude Code 重度依赖工具调用(Read、Write、Edit、Bash、Grep 等),模型能否正确选择工具、正确填入参数、正确处理工具返回的结果,直接决定了使用体验。

指标V4 ProV4 Flash对比 Claude Sonnet
工具选择准确率~92%~85%~95%
参数填充正确率~90%~82%~93%
多工具串联成功率~85%~75%~90%
工具调用重试率~8%~15%~5%

关键发现:DeepSeek 系列在工具调用上的表现与 Claude 系列仍有差距,但这个差距在快速缩小。V4 Pro 的工具调用准确率已经接近 Sonnet 水平,而 V4 Flash 在简单工具调用场景中完全够用。差距主要体现在多工具串联——当任务需要连续调用 5+ 次工具来完成任务时,DeepSeek 模型更容易在中间步骤出现偏差。

超大上下文的实际意义

1M tokens 的上下文窗口是 DeepSeek 的核心差异化优势。200K 已经能容纳大多数项目的代码库,但 1M 意味着你可以:

  • 把整个中型项目的源代码一次性放入上下文
  • 处理超长文档(如几千页的 API 文档)
  • 加载多本技术书籍进行交叉参考
  • 保持极长对话历史而无需 compaction

但在 Claude Code 的实际使用中,上下文窗口大小并不总是瓶颈。Claude Code 的 compaction 机制和上下文管理已经相当成熟,200K 窗口在日常使用中很少被耗尽。1M 的优势主要在以下场景中体现:

场景200K (Claude)1M (DeepSeek)
日常开发(单项目)✅ 足够△ 过剩
单体大项目(10 万+ 行)△ 需要 compaction✅ 更宽松
多仓库交叉分析△ 受到限制✅ 显著优势
超长文档分析△ 需分段处理✅ 一次加载
长时间对话不压缩△ 后期需要 /compact✅ 更持久

并发限制的实际影响

V4 Flash 的 2500 RPM 并发限制是一个被低估的优势。在以下场景中,它比 V4 Pro 的 500 RPM 有实质性的差异:

  • 批量任务:同时跑 10+ 个 Subagent 处理不同文件,Flash 不会触发限流
  • CI/CD 集成:高频 PR Review、自动化 Issue 处理,Flash 的吞吐量更高
  • 团队共享:多人同时使用同一 API Key,Flash 的并发余量更充足
  • 持续对话:快速连续发送多条消息,Flash 不会被限流打断节奏

对于个人用户而言,500 RPM 通常足够;但对于团队或 CI/CD 场景,2500 RPM 的余量提供了更大的灵活性。

价格优势

75% 永久降价后,DeepSeek 的定价在主流模型中具有显著的竞争力。以下是月度成本对比(同上测算标准:每天 50 次交互,平均每次 5K 输入 + 2K 输出):

模型月度成本相对于 Claude Opus相对于 Claude Sonnet
DeepSeek V4 Pro~$4.52%10%
DeepSeek V4 Flash~$1.10.5%2.4%
Claude Opus 4.7~$225--
Claude Sonnet 4.6~$45--
Claude Haiku 4.5~$12--

V4 Pro 的成本约为 Claude Sonnet 的 10%,V4 Flash 约为 Claude Haiku 的 9%。 这个价格差距意味着,即使 DeepSeek 在绝对质量上略有不足,在很多场景中它仍然是更合理的选择——尤其是成本敏感的场景和个人开发者。

思考模式的影响

DeepSeek V4 系列默认开启思考模式,这是它推理能力的来源,但也带来了实际使用中的一些影响:

正面影响

  • 即使不给详细的 Chain-of-Thought 指令,模型也会自动进行深入思考
  • 复杂的逻辑推理、数学计算、算法设计等场景中表现超出价格预期
  • 能够发现 Prompt 中的隐含假设和潜在问题

负面影响

  • 简单任务也会触发额外的推理延迟(多出 10-30 秒)
  • 在"快速问答"场景中显得"慢"——不如 Haiku 或 Flash 的即时响应
  • 思考过程消耗额外的 output tokens,略微增加成本(但在当前价格水平下影响不大)

建议:对于需要深度推理的任务(架构设计、复杂调试、算法实现),DeepSeek 的思考模式是优势;对于简单任务(代码补全、文档生成、简单问答),如果对速度敏感,可以切换到 Haiku 或 Flash。

35.3 Claude vs DeepSeek 跨家族对比

这一节是本章的核心:将两大模型家族放在同一坐标系下比较,帮助你建立跨家族的直觉。

同价位段对比

按实际使用成本,我们将模型分成三个价位段进行横向对比:

高价位段(每百万输入 $3+)

维度Claude Sonnet 4.6DeepSeek V4 Pro
输入价格$3/M$0.55/M
输出价格$15/M$2.19/M
代码生成质量★★★★☆★★★★☆
工具调用准确率更高(~95%)稍低(~92%)
上下文窗口200K1M
多轮对话稳定性更稳定偶有衰减
中文理解★★★★☆★★★★★
英文理解★★★★★★★★★☆

在这个价位段,虽然 DeepSeek V4 Pro 的实际价格远低于 Sonnet(约为其 18%),但它们在能力上是可比的。Sonnet 在工具调用的稳定性和多轮对话的一致性上仍有优势,V4 Pro 在中文场景和上下文的宽裕度上胜出。

低价位段(每百万输入 $1 以下)

维度Claude Haiku 4.5DeepSeek V4 Flash
输入价格$0.80/M$0.14/M
输出价格$4/M$0.55/M
响应速度快(思考模式略有延迟)
代码生成质量★★★☆☆★★★☆☆
简单任务可用性
并发限制极高(2500 RPM)
复杂任务可用性中等(思考模式加持)

V4 Flash 在这个价位段有一个独特优势:由于思考模式的加持,它处理中等复杂度任务的能力超出了"轻量模型"的预期。一个直观的感受是:V4 Flash 像一个"有脑子的 Haiku"——保持了轻量模型的速度和成本优势,但在需要一点推理能力的时候不会让你失望。

代码生成质量横向对比

我们用一组标准化的编程任务(涵盖 TypeScript、Python、Rust 三种语言,从简单函数到完整模块)对各模型进行了横向测试:

任务难度递增 →
                Haiku    Flash    Sonnet   V4 Pro   Opus
简单函数实现    ★★★☆☆   ★★★★☆   ★★★★☆   ★★★★☆   ★★★★★
中等模块开发    ★★☆☆☆   ★★★☆☆   ★★★★☆   ★★★★☆   ★★★★★
复杂系统设计    ★★☆☆☆   ★★★☆☆   ★★★★☆   ★★★★☆   ★★★★★
边界条件处理    ★★★☆☆   ★★★☆☆   ★★★★☆   ★★★★☆   ★★★★★
代码可读性      ★★★☆☆   ★★★☆☆   ★★★★☆   ★★★★☆   ★★★★★

模式总结:在简单到中等复杂度,所有模型的差距都在可接受范围内。真正的差异出现在复杂度和精度要求同时提高时——Opus 和 V4 Pro 能保持质量,而轻量模型开始出现遗漏和偏差。

中文理解能力对比

这是一个对中文开发者特别重要的维度。Claude 的中文能力很强,但 DeepSeek 作为中文原生模型,在中文场景中有天然优势:

场景Claude 系列DeepSeek 系列
中文 Prompt 理解优秀,偶有英文思维痕迹自然,理解中文表达的微妙含义
中文代码注释生成良好更地道
中文技术文档写作良好更流畅、更符合中文技术写作习惯
中文代码变量命名能理解但不主动推荐自然推荐合适的中文拼音/英文命名
中英混排 Prompt良好优秀,切换自然
理解中文技术社区术语需要上下文原生理解

如果你的工作语言以中文为主,尤其是需要生成中文文档、处理中文代码注释、或与中文技术社区打交道,DeepSeek 的优势值得考虑。

工具调用 / Agent 行为对比

Claude Code 的核心是 Agent——模型通过工具与代码库交互。以下是两大模型家族在 Agent 场景中的行为差异:

行为维度Claude 系列DeepSeek 系列
工具调用节奏稳定、可预测偶尔出现多余的确认性调用
Read 行为精准读取需要的片段有时读取范围偏大(因 1M 窗口习惯?)
Edit 准确率高,old_string 匹配精确稍低,偶尔需重试
Bash 命令安全性谨慎,危命操作前确认同样谨慎,行为正常
Grep/Glob 使用高效,搜索模式合理可用,搜索模式偶有冗余
多步骤任务规划逻辑清晰,步骤合理逻辑清晰,步骤合理
错误恢复能自主发现和修正错误能自主发现和修正错误
任务边界判断准确判断任务是否完成偶有过早结束或过度执行

关键差异:Claude 系列在 Agent 行为上更"老练"——它似乎对这个工具系统有更深入的理解,知道什么时候该用什么工具,什么时候该停止。DeepSeek 系列在大多数场景中表现良好,但偶尔会出现微妙的偏差——比如多读了一些不需要的文件,或者在任务已经完成后多做了一个确认性的 Read。

这些差异在实际使用中大多不可感知。只有在高频使用、或者对精度有极高要求的场景中,Claude 的稳定性优势才会显现。

上下文利用效率对比

虽然 DeepSeek 的窗口是 Claude 的 5 倍(1M vs 200K),但窗口大小不等于利用效率

维度Claude 200KDeepSeek 1M
上下文有效利用率高,能精确引用关键信息中等,有时引用范围过宽
长对话记忆保持良好良好
信息检索精度高,大海捞针测试表现出色中等偏上
Compaction 后的恢复自然自然
长篇上下文中的推理均匀稳定开头结尾较好,中间偶有衰减

Claude 的 200K 窗口虽然比 DeepSeek 的 1M 小,但 Anthropic 在上下文管理和信息检索方面投入了大量优化,使得 Claude 能更高效地利用它的上下文空间。DeepSeek 的 1M 窗口更"奢侈"——你可以不那么在意上下文预算,但这并不意味着模型总能高效利用全部 1M 空间。

不是"哪个更好",而是"哪个更适合当前任务"

经过以上对比,一个重要的认知转变是:

没有"更好"的模型,只有"更适合当前任务"的模型。

一个高效的 Claude Code 用户,不会固定使用某一个模型,而是根据任务特性动态切换。这和木匠不会只用一把锤子的道理一样——你有整个工具箱,关键是知道什么时候用什么。

以下是一个简单的决策启发式:

当前任务需要什么?
├── 需要极致推理深度? → Opus(钱花在刀刃上)
├── 需要可靠的日常伙伴?  → Sonnet(70% 时间的选择)
├── 需要速度 + 成本最低? → Haiku / Flash
├── 中文为主的工作?     → V4 Pro / V4 Flash(中文原生优势)
├── 超大上下文需求?     → V4 Pro / V4 Flash(1M 窗口)
├── 团队多人共享 API?   → V4 Flash(2500 RPM 并发)
└── 不能出错的审查?     → Opus / Sonnet(工具调用更稳定)

35.4 不同任务类型的模型推荐矩阵

基于前面的三层对比分析,以下是面向十种常见任务类型的推荐矩阵。这不是一个教条——如果你对某个模型的某个场景有更好的体验,相信你的实际感受。

完整推荐矩阵

任务类型首选备选理由
简单代码补全V4 FlashHaiku成本极低,速度够快,对于单行/数行的补全不需要深度推理
日常功能开发Sonnet / V4 FlashV4 ProSonnet 覆盖 70% 日常开发;预算有限时 V4 Flash 够用
复杂架构设计OpusV4 Pro需要权衡多种约束、预判边缘效应,Opus 的推理深度有实质优势
深度调试OpusSonnet复杂 Bug 的根因追踪需要多步骤推理和逻辑链条,Opus 最可靠
代码审查SonnetV4 Pro需要平衡审查深度和成本,Sonnet 是性价比最佳点
文档生成V4 FlashHaiku不需要强推理,成本优势明显;中文文档 DeepSeek 更地道
批量重构V4 FlashSonnet批量场景需要高并发(Flash 2500 RPM)+ 低成本
安全审查OpusSonnet这是"不能出错"的场景,安全审查的疏漏代价远超模型成本差异
学习新技术OpusSonnet学习时你需要深入的解释和准确的推理,质量比速度重要
CI/CD 自动化V4 FlashHaiku高频调用对成本敏感,自动化任务通常不需要顶级推理
中文技术写作V4 ProV4 FlashDeepSeek 的中文输出更地道、更符合中文技术写作习惯
超大项目理解V4 ProV4 Flash1M 上下文窗口在大项目初始化理解时有天然优势
Subagent 并行V4 FlashHaiku多个 Subagent 并发时的总成本控制和限流避免
需求分析/技术方案OpusV4 Pro需要理解业务需求并将其映射为技术方案,推理深度很重要

按开发者角色推荐

不同角色的开发者有不同的模型需求侧重:

角色日常默认复杂任务说明
独立开发者V4 Pro / FlashOpus成本敏感,用 DeepSeek 做主力 + Opus 解决难题
团队主力开发SonnetOpus公司负担 API,追求质量和稳定性
技术 Lead/架构师Opus / V4 ProOpus输出质量优先,架构决策不能出错
开源贡献者V4 FlashV4 Pro成本可控,工具够用
编程学习者Sonnet / OpusOpus学习阶段需要准确、深入的解释
DevOps/CI 工程师V4 FlashHaiku自动化场景,成本 + 并发优先

按项目阶段推荐

阶段推荐模型原因
项目探索/理解V4 Pro / Opus需要深度理解代码库结构,大上下文有帮助
架构设计Opus设计决策影响深远,值得到位
日常开发迭代Sonnet / V4 Flash平衡速度和质量
代码审查/合并前Sonnet / Opus审查要求精度,不能放过隐患
文档完善V4 Flash低成本、高速度
上线前检查Opus这是质量把关的最后一道防线

模型选择的 ROI 公式

最后用一句话总结模型选择的底层逻辑:

模型 ROI = (任务质量收益 - 模型成本) / 人工时间节省

当任务质量要求极高时 → 选贵模型
当任务批量且简单时   → 选便宜模型
当你不确定时         → 从 Sonnet 开始

35.5 cc-switch 高级配置技巧

cc-switch 是 Claude Code 的 GUI 模型切换工具。我们在第 3 章介绍了基本配置,这里给出面向模型选择策略的高级配置方案。

多模型快速切换工作流

cc-switch 的核心价值不是让你手动选择模型——而是让你建立场景化的模型切换习惯。以下是高效用户的工作流:

早上 9:00  ──→ 检查今日任务
              ├── 简单任务列表 → /model flash  ← 低成本快速迭代
              ├── 有复杂需求分析 → /model opus  ← 深度思考
              └── 有代码审查 → /model sonnet    ← 平衡模式

中午 12:00 ──→ 处理日常开发
              └── /model sonnet 或 /model v4-pro  ← 主力模型

下午 3:00  ──→ 遇到难题
              └── /model opus  ← 投入"重型武器"

下午 5:30  ──→ 批量任务(生成测试、写文档)
              └── /model flash 或 /model haiku  ← 速度优先

这不是形式主义——固定时间段绑定模型类型,可以消除"每次都要想该用哪个模型"的决策疲劳。你会逐渐建立肌肉记忆。

场景化配置方案

以下三套 cc-switch 配置覆盖了不同的使用模式:

方案 A:双模型极简方案(推荐新手)

json
{
  "models": [
    {
      "name": "opus",
      "displayName": "Opus 深度思考",
      "provider": "anthropic",
      "model": "claude-opus-4-7-20250514",
      "useWhen": "复杂架构 / 深度调试 / 安全审查"
    },
    {
      "name": "sonnet",
      "displayName": "Sonnet 日常主力",
      "provider": "anthropic",
      "model": "claude-sonnet-4-6-20250514",
      "useWhen": "日常开发 / 代码审查 / 默认选择"
    }
  ]
}

这套方案简单直接:日常用 Sonnet,遇到难题一键切 Opus。认知负担最小,适合刚开始使用多模型策略的用户。

方案 B:三模型性价比方案(推荐独立开发者)

json
{
  "models": [
    {
      "name": "v4-pro",
      "displayName": "V4 Pro 深度推理",
      "provider": "deepseek",
      "model": "deepseek-chat",
      "useWhen": "中文场景 / 日常主力 / 大型项目"
    },
    {
      "name": "v4-flash",
      "displayName": "V4 Flash 轻量快速",
      "provider": "deepseek",
      "model": "deepseek-chat",
      "useWhen": "批量重构 / CI / 文档生成"
    },
    {
      "name": "sonnet",
      "displayName": "Sonnet 保底方案",
      "provider": "anthropic",
      "model": "claude-sonnet-4-6-20250514",
      "useWhen": "DeepSeek 搞不定时的后备"
    }
  ]
}

这套方案以 DeepSeek 为主力(极大降低成本),保留 Sonnet 作为"保底方案"。适合对成本敏感的独立开发者。

方案 C:五模型全场景方案(推荐资深用户)

json
{
  "models": [
    {
      "name": "opus",
      "displayName": "Opus 最强推理",
      "provider": "anthropic",
      "model": "claude-opus-4-7-20250514"
    },
    {
      "name": "sonnet",
      "displayName": "Sonnet 均衡主力",
      "provider": "anthropic",
      "model": "claude-sonnet-4-6-20250514"
    },
    {
      "name": "haiku",
      "displayName": "Haiku 极速响应",
      "provider": "anthropic",
      "model": "claude-haiku-4-5-20250514"
    },
    {
      "name": "v4-pro",
      "displayName": "V4 Pro 中文深度",
      "provider": "deepseek",
      "model": "deepseek-chat"
    },
    {
      "name": "v4-flash",
      "displayName": "V4 Flash 批量引擎",
      "provider": "deepseek",
      "model": "deepseek-chat"
    }
  ]
}

这套方案给了你最大的灵活性,但需要你对每个模型的特性有清晰的认识——这也是本章 35.1-35.4 节的价值所在。

cc-switch 配置备份与迁移

cc-switch 的配置文件通常位于 ~/.claude/ 或项目的 .claude/ 目录下。在不同的工作环境之间迁移配置时,注意以下几点:

  1. API Key 不要放在配置文件中:保持 API Key 在环境变量中,配置文件只记录模型名称和 provider
  2. 共享团队配置:将 .claude/ 目录下的 cc-switch 配置纳入版本控制(不含 secrets),团队成员可以复用同一套模型选择策略
  3. 备注 useWhen 信息:在配置的注释或自定义字段中加入"何时使用"的说明,方便团队成员理解每个模型的定位

团队统一模型策略

如果你负责推广团队使用 Claude Code(第 34 章已讨论),统一模型策略是推广的重要环节:

原则一:提供默认,允许覆盖。在团队配置中设定默认模型(推荐 Sonnet 或 V4 Pro),但允许成员在特定任务中切换。不要强制每个人只用同一个模型——不同的任务需要不同的模型。

原则二:成本透明,按需使用。在团队中建立模型成本的共识——不是"越便宜越好",而是"用合适的模型做合适的事"。可以参考 35.4 节的推荐矩阵制定团队指南。

原则三:保留 Opus 作为"团队共享资源"。如果团队预算有限,可以考虑将 Opus 的使用限制在真正需要它的场景——不要让 Opus 写 commit message,但也不要犹豫在复杂架构决策时调用它。

原则四:定期回顾模型选择。每 1-2 个月回顾团队各模型的使用量分布。一个健康的分布大概是:

Opus:   5-10%   ← 复杂架构、深度调试、安全审查
Sonnet: 50-60%  ← 日常开发主力
V4 Pro: 15-25%  ← 中文场景、成本敏感推理
Flash:  10-15%  ← 批量任务、CI/CD、文档
Haiku:  5%      ← 极简单任务

如果 Opus 占比超过 20%,说明团队可能在用"高射炮打蚊子";如果 Flash 占比超过 40%,可能有些本该用 Sonnet 的场景被降级处理了。

35.6 本章小结

本章通过四层递进对比,建立了一套完整的模型选择决策体系:

第一层:家族内部对比。Claude 家族中,Opus 提供最强的推理能力和代码质量,适合那 20% 的复杂场景;Sonnet 是覆盖 70% 日常场景的黄金默认值;Haiku 在简单任务中提供极致的速度和成本优势。DeepSeek 家族中,V4 Pro 以极低的价格提供接近 Opus 的推理深度;V4 Flash 在高并发、低成本场景中表现突出。

第二层:跨家族横向对比。在工具调用稳定性和多轮对话一致性上,Claude 仍有优势——这对 Agent 场景至关重要。但在中文理解、上下文宽裕度和成本控制上,DeepSeek 有显著优势。两者的差距在快速缩小,选择哪个更多取决于任务特性而非绝对能力。

第三层:任务推荐矩阵。基于十种常见任务类型,给出了首选和备选模型以及选择理由。核心原则不是"选最好的模型",而是"选最适合当前任务的模型"。

第四层:cc-switch 配置实战。提供了三套配置方案(双模型/三模型/五模型),覆盖从新手到资深用户的不同需求。同时给出了团队统一模型策略的原则。

本章的核心思想可以浓缩为三句话

  1. Sonnet 是你的日常伙伴——70% 的时间里它是最佳选择
  2. Opus 是你的秘密武器——在真正复杂的问题上,它的价值远超它的成本
  3. DeepSeek 是你的性价比之选——当预算有限或中文为主时,V4 Pro 和 V4 Flash 是出色的替代方案

模型会不断更新换代,本章的具体价格和版本号可能过时。但决策框架不会过时——理解每个模型的相对定位,根据任务特性动态选择,用 cc-switch 降低切换成本——这三条原则将在很长一段时间内指导你的模型选择。

下一章,我们将目光投向未来,探讨 Agentic Coding 的发展趋势和开发者角色的演变。