Flash 时代降临:DeepSeek V4 与 Gemini 3 Flash 联手,打造 Cline 的极致能效比

⏳ 约2分钟 · 692汉字+107词

【编者注】 本文写于 2026 年 4 月,当时以「爱加油(aijia.you)」平台为例演示模型接入。该平台已于 2026 年 6 月停止运营。文中关于 DeepSeek V4 Flash 和 Gemini 3 Flash 能效比的判断本身仍然有效;若要自行接入,直接用 DeepSeek 开放平台OpenRouter 即可,截图部分作为历史记录保留。

最近 AI 圈最火的消息莫过于 DeepSeek V4 的发布。作为国产大模型的骄傲,DeepSeek 每次更新都能在性能和成本之间找到一个极其恐怖的平衡点。

DeepSeek V4 发布后,DeepSeek V4 Flash 第一时间可以在各大 API 平台获取。出于成本和实用性的双重考虑,我直接接入来测试。

为什么是 Flash?因为在 2026 年的今天,我们已经过了那个盲目追求“参数最大、价格最贵”模型的阶段。Flash 模型(闪电版/轻量版)已经进化到了一个临界点:在 90% 的日常任务中,它们的速度和逻辑已经完全够用,而成本却只有旗舰模型的零头。

DeepSeek V4 Flash:性价比的极致

DeepSeek V4 Flash 的响应速度极快,非常适合处理那些需要快速反馈的简单代码修改、文档总结或者初步的逻辑梳理。

(注:上图为当时使用的 API 平台后台截图,作为历史记录保留。现在可直接前往 DeepSeek 开放平台 获取 API Key。)

Gemini 3 Flash:Cline Plan Mode 的“最强大脑”

除了 DeepSeek,Google 最近发布的 Gemini 3 Flash 同样令人惊艳。甚至在 Google AI Studio 的官方介绍中,Gemini 3 Flash 也被列为他们 most powerful model 之一。

(注:Google 官方背书,Flash 并不代表弱,而是代表了极高的能效比。)

在我的日常开发流中,我给 Cline 配置了一套“黄金组合”:

  • Plan Mode (计划模式):使用 Gemini 3 Flash。利用它庞大的上下文窗口和极速的逻辑推理,帮我梳理复杂的开发计划。
  • Act Mode (执行模式):根据任务复杂度,切换 DeepSeek V4 Flash 或其他旗舰模型。

我现在写这篇文章时,Cline 正在使用的就是 Gemini 3 Flash Preview。

(注:实测证明,用 Flash 模型跑 Plan Mode,不仅计划做得准,而且几乎感觉不到 Token 的消耗。)

实战:如何在 Cline 中接入自己的 API?

你还没试过在 Cline 里使用自己的 API Key(BYOK)?

详细教程在[《如何使用自己的API Key调用Cline》](/如何使用自己的API Key调用Cline/),这里快速复习核心步骤:

  1. 获取 API Key:前往 DeepSeek 开放平台OpenRouter 注册并创建 Key。
  2. 配置 Cline
    • API Provider: 选择 OpenAI Compatible
    • Base URL: DeepSeek 填 https://api.deepseek.com/v1,OpenRouter 填 https://openrouter.ai/api/v1
    • API Key: 填入你的 Key。
    • Model ID: DeepSeek 填 deepseek-chat,Gemini 系列通过 OpenRouter 填对应 model slug。
  3. 分模式配置:在 Cline 的设置里,可以分别为 Plan Mode 和 Act Mode 指定不同的模型。

结语

Flash 时代的降临,意味着 AI 助手不再是昂贵的奢侈品,而是可以 24 小时待命的廉价劳动力。

DeepSeek V4 Flash 的稳健,Gemini 3 Flash 的博学,直接接官方 API,AI 使用成本大降。

还没试过的朋友,去 DeepSeek 开放平台 开个账号,五分钟就能配好 Cline。