DeepSeek V4发布:接近前沿水平,价格比Gemini、OpenAI等低得多!
2026/5/4 3:41:01 网站建设 项目流程

赞助商信息

赞助商为 MongoDB,可参加2026年5月7日在伦敦举行的MongoDB.local活动,了解团队如何将AI从原型推向生产。

DeepSeek V4模型概况

2026年4月24日消息,中国AI实验室DeepSeek上次发布的模型是V3.2(以及V3.2 Speciale),于去年12月发布。如今,他们推出了备受期待的V4系列的首批两款预览模型,分别是 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。

这两款模型均为100万token上下文的混合专家模型。Pro模型总参数为1.6T,激活参数为49B;Flash模型总参数为284B,激活参数为13B,且都采用标准的MIT许可证。

DeepSeek-V4-Pro成为新的最大开源权重模型,它比Kimi K2.6(1.1T)和GLM - 5.1(754B)更大,是DeepSeek V3.2(685B)的两倍多。

在Hugging Face上,Pro模型大小为865GB,Flash模型为160GB。期望经过轻度量化的Flash模型能在128GB M5 MacBook Pro上运行,若能从磁盘流式加载必要的激活专家,Pro模型也有可能在上面运行。

模型测试情况

目前,通过 OpenRouter,使用 llm - openrouter 对这些模型进行了测试,代码如下:

llm install llm - openrouter
llm openrouter refresh
llm - m openrouter/deepseek/deepseek - v4 - pro 'Generate an SVG of a pelican riding a bicycle'

还展示了 DeepSeek-V4-Flash生成的鹈鹕图和 DeepSeek-V4-Pro生成的鹈鹕图,并可对比 去年12月从DeepSeek V3.2、去年8月从V3.1 以及 2025年3月从V3 - 0324 得到的鹈鹕图。

成本优势显著

鹈鹕图效果不错,但更值得关注的是其成本。DeepSeek V4是非常便宜的模型,其 定价页面显示,Flash模型输入每百万token收费0.14美元,输出每百万token收费0.28美元;Pro模型输入每百万token收费1.74美元,输出每百万token收费3.48美元。

与Gemini、OpenAI和Anthropic前沿模型对比如下:

模型输入(美元/百万)输出(美元/百万)
DeepSeek V4 Flash$0.14$0.28
GPT - 5.4 Nano$0.20$1.25
Gemini 3.1 Flash - Lite$0.25$1.50
Gemini 3 Flash Preview$0.50$3
GPT - 5.4 Mini$0.75$4.50
Claude Haiku 4.5$1$5
DeepSeek V4 Pro$1.74$3.48
Gemini 3.1 Pro$2$12
GPT - 5.4$2.50$15
Claude Sonnet 4.6$3$15
Claude Opus 4.7$5$25
GPT - 5.5$5$30

DeepSeek-V4-Flash是小型模型中最便宜的,比OpenAI的GPT - 5.4 Nano还便宜;DeepSeek-V4-Pro是较大前沿模型中最便宜的。

效率与性能情况

DeepSeek论文显示,他们在此次发布中注重效率,尤其是针对较长上下文的提示。在100万token上下文场景下,DeepSeek-V4-Pro单token的浮点运算次数(以等效FP8浮点运算次数衡量)仅为DeepSeek-V3.2的27%,KV缓存大小仅为10%;DeepSeek-V4-Flash单token的浮点运算次数仅为DeepSeek-V3.2的10%,KV缓存大小仅为7%。

论文中自行报告的基准测试表明,Pro模型与其他前沿模型具有竞争力,但有说明:“通过扩展推理token,DeepSeek-V4-Pro-Max在标准推理基准测试中表现优于GPT - 5.2和Gemini - 3.0 - Pro。然而,其性能略逊于GPT - 5.4和Gemini - 3.1 - Pro,这表明其发展轨迹比最先进的前沿模型大约落后3到6个月。”

后续期待

一直关注 huggingface.co/unsloth/models,预计Unsloth团队很快会推出一系列量化版本,很期待看看Flash模型在自己机器上的运行效果。

近期文章与相关链接

LLM 0.32a0是一次重大的向后兼容重构 —— 2026年4月29日

追踪已失效的OpenAI与微软AGI条款的历史 —— 2026年4月27日

本文发布于 2026年4月24日 上午6:01 ,可在 Mastodon、Bluesky、Twitter 上关注作者,或订阅作者的时事通讯。

月度简报与赞助

每月赞助10美元,可获得当月最重要的大语言模型(LLM)发展动态的精选邮件摘要。可赞助并订阅。

上下篇文章

下一篇:追踪已失效的OpenAI与微软AGI条款的历史

上一篇:使用适用于网络的LiteParse在浏览器中提取PDF文本

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询