DeepSeek V4发布：接近前沿水平，价格比Gemini、OpenAI等低得多！-创锋一号

赞助商信息

赞助商为 MongoDB，可参加2026年5月7日在伦敦举行的MongoDB.local活动，了解团队如何将AI从原型推向生产。

DeepSeek V4模型概况

2026年4月24日消息，中国AI实验室DeepSeek上次发布的模型是V3.2（以及V3.2 Speciale），于去年12月发布。如今，他们推出了备受期待的V4系列的首批两款预览模型，分别是 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。

这两款模型均为100万token上下文的混合专家模型。Pro模型总参数为1.6T，激活参数为49B；Flash模型总参数为284B，激活参数为13B，且都采用标准的MIT许可证。

DeepSeek-V4-Pro成为新的最大开源权重模型，它比Kimi K2.6（1.1T）和GLM - 5.1（754B）更大，是DeepSeek V3.2（685B）的两倍多。

在Hugging Face上，Pro模型大小为865GB，Flash模型为160GB。期望经过轻度量化的Flash模型能在128GB M5 MacBook Pro上运行，若能从磁盘流式加载必要的激活专家，Pro模型也有可能在上面运行。

模型测试情况

目前，通过 OpenRouter，使用 llm - openrouter 对这些模型进行了测试，代码如下：

llm install llm - openrouter
llm openrouter refresh
llm - m openrouter/deepseek/deepseek - v4 - pro 'Generate an SVG of a pelican riding a bicycle'

还展示了 DeepSeek-V4-Flash生成的鹈鹕图和 DeepSeek-V4-Pro生成的鹈鹕图，并可对比去年12月从DeepSeek V3.2、去年8月从V3.1 以及 2025年3月从V3 - 0324 得到的鹈鹕图。

成本优势显著

鹈鹕图效果不错，但更值得关注的是其成本。DeepSeek V4是非常便宜的模型，其定价页面显示，Flash模型输入每百万token收费0.14美元，输出每百万token收费0.28美元；Pro模型输入每百万token收费1.74美元，输出每百万token收费3.48美元。

与Gemini、OpenAI和Anthropic前沿模型对比如下：

模型	输入（美元/百万）	输出（美元/百万）
DeepSeek V4 Flash	$0.14	$0.28
GPT - 5.4 Nano	$0.20	$1.25
Gemini 3.1 Flash - Lite	$0.25	$1.50
Gemini 3 Flash Preview	$0.50	$3
GPT - 5.4 Mini	$0.75	$4.50
Claude Haiku 4.5	$1	$5
DeepSeek V4 Pro	$1.74	$3.48
Gemini 3.1 Pro	$2	$12
GPT - 5.4	$2.50	$15
Claude Sonnet 4.6	$3	$15
Claude Opus 4.7	$5	$25
GPT - 5.5	$5	$30

DeepSeek-V4-Flash是小型模型中最便宜的，比OpenAI的GPT - 5.4 Nano还便宜；DeepSeek-V4-Pro是较大前沿模型中最便宜的。

效率与性能情况

DeepSeek论文显示，他们在此次发布中注重效率，尤其是针对较长上下文的提示。在100万token上下文场景下，DeepSeek-V4-Pro单token的浮点运算次数（以等效FP8浮点运算次数衡量）仅为DeepSeek-V3.2的27%，KV缓存大小仅为10%；DeepSeek-V4-Flash单token的浮点运算次数仅为DeepSeek-V3.2的10%，KV缓存大小仅为7%。

论文中自行报告的基准测试表明，Pro模型与其他前沿模型具有竞争力，但有说明：“通过扩展推理token，DeepSeek-V4-Pro-Max在标准推理基准测试中表现优于GPT - 5.2和Gemini - 3.0 - Pro。然而，其性能略逊于GPT - 5.4和Gemini - 3.1 - Pro，这表明其发展轨迹比最先进的前沿模型大约落后3到6个月。”

后续期待

一直关注 huggingface.co/unsloth/models，预计Unsloth团队很快会推出一系列量化版本，很期待看看Flash模型在自己机器上的运行效果。

近期文章与相关链接

LLM 0.32a0是一次重大的向后兼容重构 —— 2026年4月29日

追踪已失效的OpenAI与微软AGI条款的历史 —— 2026年4月27日

本文发布于 2026年4月24日上午6:01 ，可在 Mastodon、Bluesky、Twitter 上关注作者，或订阅作者的时事通讯。

月度简报与赞助

每月赞助10美元，可获得当月最重要的大语言模型（LLM）发展动态的精选邮件摘要。可赞助并订阅。

上下篇文章

下一篇：追踪已失效的OpenAI与微软AGI条款的历史

上一篇：使用适用于网络的LiteParse在浏览器中提取PDF文本

企业官网建设流程全解析

赞助商信息

DeepSeek V4模型概况

模型测试情况

成本优势显著

效率与性能情况

后续期待

近期文章与相关链接

月度简报与赞助

上下篇文章

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

赞助商信息

DeepSeek V4模型概况

模型测试情况

成本优势显著

效率与性能情况

后续期待

近期文章与相关链接

月度简报与赞助

上下篇文章

热门文章

文章分类

标签云

相关文章

告别手忙脚乱：用这些Verdi快捷键和窗口操作技巧，让你的仿真效率翻倍

THINKSAFE：平衡大型推理模型安全与性能的自对齐技术

MIO Plugin SDK：AI智能体插件开发全解析与实战指南

需要专业的网站建设服务？