赞助商信息
赞助商为 MongoDB,可参加2026年5月7日在伦敦举行的MongoDB.local活动,了解团队如何将AI从原型推向生产。
DeepSeek V4模型概况
2026年4月24日消息,中国AI实验室DeepSeek上次发布的模型是V3.2(以及V3.2 Speciale),于去年12月发布。如今,他们推出了备受期待的V4系列的首批两款预览模型,分别是 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。
这两款模型均为100万token上下文的混合专家模型。Pro模型总参数为1.6T,激活参数为49B;Flash模型总参数为284B,激活参数为13B,且都采用标准的MIT许可证。
DeepSeek-V4-Pro成为新的最大开源权重模型,它比Kimi K2.6(1.1T)和GLM - 5.1(754B)更大,是DeepSeek V3.2(685B)的两倍多。
在Hugging Face上,Pro模型大小为865GB,Flash模型为160GB。期望经过轻度量化的Flash模型能在128GB M5 MacBook Pro上运行,若能从磁盘流式加载必要的激活专家,Pro模型也有可能在上面运行。
模型测试情况
目前,通过 OpenRouter,使用 llm - openrouter 对这些模型进行了测试,代码如下:
llm install llm - openrouter
llm openrouter refresh
llm - m openrouter/deepseek/deepseek - v4 - pro 'Generate an SVG of a pelican riding a bicycle'
还展示了 DeepSeek-V4-Flash生成的鹈鹕图和 DeepSeek-V4-Pro生成的鹈鹕图,并可对比 去年12月从DeepSeek V3.2、去年8月从V3.1 以及 2025年3月从V3 - 0324 得到的鹈鹕图。
成本优势显著
鹈鹕图效果不错,但更值得关注的是其成本。DeepSeek V4是非常便宜的模型,其 定价页面显示,Flash模型输入每百万token收费0.14美元,输出每百万token收费0.28美元;Pro模型输入每百万token收费1.74美元,输出每百万token收费3.48美元。
与Gemini、OpenAI和Anthropic前沿模型对比如下:
| 模型 | 输入(美元/百万) | 输出(美元/百万) |
|---|---|---|
| DeepSeek V4 Flash | $0.14 | $0.28 |
| GPT - 5.4 Nano | $0.20 | $1.25 |
| Gemini 3.1 Flash - Lite | $0.25 | $1.50 |
| Gemini 3 Flash Preview | $0.50 | $3 |
| GPT - 5.4 Mini | $0.75 | $4.50 |
| Claude Haiku 4.5 | $1 | $5 |
| DeepSeek V4 Pro | $1.74 | $3.48 |
| Gemini 3.1 Pro | $2 | $12 |
| GPT - 5.4 | $2.50 | $15 |
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Opus 4.7 | $5 | $25 |
| GPT - 5.5 | $5 | $30 |
DeepSeek-V4-Flash是小型模型中最便宜的,比OpenAI的GPT - 5.4 Nano还便宜;DeepSeek-V4-Pro是较大前沿模型中最便宜的。
效率与性能情况
DeepSeek论文显示,他们在此次发布中注重效率,尤其是针对较长上下文的提示。在100万token上下文场景下,DeepSeek-V4-Pro单token的浮点运算次数(以等效FP8浮点运算次数衡量)仅为DeepSeek-V3.2的27%,KV缓存大小仅为10%;DeepSeek-V4-Flash单token的浮点运算次数仅为DeepSeek-V3.2的10%,KV缓存大小仅为7%。
论文中自行报告的基准测试表明,Pro模型与其他前沿模型具有竞争力,但有说明:“通过扩展推理token,DeepSeek-V4-Pro-Max在标准推理基准测试中表现优于GPT - 5.2和Gemini - 3.0 - Pro。然而,其性能略逊于GPT - 5.4和Gemini - 3.1 - Pro,这表明其发展轨迹比最先进的前沿模型大约落后3到6个月。”
后续期待
一直关注 huggingface.co/unsloth/models,预计Unsloth团队很快会推出一系列量化版本,很期待看看Flash模型在自己机器上的运行效果。
近期文章与相关链接
LLM 0.32a0是一次重大的向后兼容重构 —— 2026年4月29日
追踪已失效的OpenAI与微软AGI条款的历史 —— 2026年4月27日
本文发布于 2026年4月24日 上午6:01 ,可在 Mastodon、Bluesky、Twitter 上关注作者,或订阅作者的时事通讯。
月度简报与赞助
每月赞助10美元,可获得当月最重要的大语言模型(LLM)发展动态的精选邮件摘要。可赞助并订阅。
上下篇文章
下一篇:追踪已失效的OpenAI与微软AGI条款的历史
上一篇:使用适用于网络的LiteParse在浏览器中提取PDF文本