通过技术上的硬核创新,DeepSeek-V4实现了“加量、提速、大降价”
千呼万唤始出来!4月24日,DeepSeek(深度求索)宣布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。
这不是一次常规的模型迭代。DeepSeek表示,V4拥有百万字超长上下文,在Agent(智能体)能力、世界知识和推理性能上均实现国内与开源领域的领先,并且相比于传统方法大幅降低了对计算和显存的需求,由此迈入百万字上下文普惠时代。
对于普通用户而言,DeepSeek升级版到底强在哪?如果你将问题抛给DeepSeek-V4,它的回答是:“加量、提速、大降价。”
全面升级,一次性处理《三体》三部曲的长文本
这几天,用户打开DeepSeek,会出现以下提示:DeepSeek-V4预览版发布,具备世界顶级推理性能,Agent能力大幅提高。用户只需要登录DeepSeek官网或官方App,就可以免费体验最新的DeepSeek-V4。
据了解,DeepSeek-V4推出两个版本:高性能的“Pro版”和高性价比的“Flash版”,分别对应目前官方网页端、App界面的专家模式和快速模式。那么,相比前代模型,V4增加了哪些技能点?DeepSeek-V4给出了以下回答:
在上下文长度方面,以前版本较短,处理长内容容易“断片”;新版本标配100万token(词元),用户一口气读完《三体》三部曲还绰绰有余。以前让AI读长篇报告、几十页合同或整本书,它可能会忘记前面的内容。现在V4的“记性”比较好,用户再也不用把长文分段“喂”给它,直接一次全输入过去,它也能抓住所有细节。
在核心能力方面,新版本对于长文本理解和Agent能力大幅增强,能处理复杂的工作流、代码任务和文档分析。比如自动在代码库里找漏洞,根据用户要求生成一份完整的汇报PPT等。
在技术架构方面,此前版本是传统注意力机制,V4创新采用注意力压缩技术,让模型处理长文时,计算量降至原来的27%,显存占用降至10%,效率极高。
在价格方面,新版本把AI大模型的使用成本拉到“白菜价”。V4-Flash版每百万token输入价格1元,输出价格2元。如果内容能命中缓存(可以理解为AI记住了用户之前提过的东西),输入价格低至0.2元。V4-Pro版每百万token输入价格为12元,输出价格为24元,价格只有海外顶级模型的14%~35%。
对此,DeepSeek-V4总结道:通过技术上的硬核创新,V4实现了“加量、提速、大降价”的全面升级,一个好用又不贵的AI时代越来越近。
协同作战,“用国产算力跑国产模型”
去年初,DeepSeek横空出世,以高性能和低训练成本的开源模型能力让全球AI(人工智能)圈为之震动,迎来“DeepSeek时刻”。
对于DeepSeek-V4预览版本此次上线,虽然圈内仍然给予极高关注,但用户端已经少了一年多前的兴奋与沸腾。
“毕竟现在市面上涌现了不少国产大模型,大家在调用工具时,并不会完全依赖DeepSeek。”多位用户表示,在智能体越来越深入人心的当下,DeepSeek-V4仍然是一个纯文本模型,并不具备多模态识别能力,让人略感遗憾。
事实上,此次V4最受瞩目的,是首次在官方技术报告中,把国产芯片和英伟达GPU写进同一份硬件验证清单。
其技术报告中明确指出:“我们验证了细粒度EP(专家并行)方案在英伟达GPU(图形处理器)和华为昇腾NPU(嵌入式神经网络处理器)双平台上的表现。”
EP方案是一种专门为MoE(混合专家模型)架构设计的分布式推理策略。这意味着,DeepSeek正在尝试使用国产算力做推理。
不仅如此,DeepSeek在发布中明确表示,受限于高端算力,V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,V4-Pro的价格会大幅下调。
4月24日,华为也发文称,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。“用国产算力跑国产模型”,中国AI产业正在从“单点突破”走向“体系作战”。
延伸阅读
南京市政务大模型平台在全省率先完成DeepSeekV4部署
依托全市统一的政务云环境和国产AI算力资源池,南京在江苏省率先于政务外网环境完成DeepSeek-V4私有化部署,提供了安全可靠的DeepSeek-V4使用环境。
今年4月24日,全球AI领域备受瞩目的DeepSeek-V4正式开源发布,这一国产大模型的重大进展,为政务智能化应用提供了更强大的技术底座。
南京市城市数字治理中心(市数治中心)敏锐把握技术前沿,立即启动部署工作。目前,DeepSeek-V4已通过南京市政务大模型(MaaS)平台向全市各部门开放申请使用。各部门可通过平台便捷调用DeepSeek-V4的强大能力,快速构建各类政务智能应用,如政策咨询智能体、文档智能处理、数据分析与报告生成等。
为进一步丰富南京政务大模型能力生态,MaaS平台还同步上线了Qwen3.5及MiniMax2.7两款国内头部开源大模型。至此,南京市政务大模型平台已汇聚DeepSeek、Qwen、MiniMax等多款领先国产大模型,为各部门开展“人工智能+政务”场景应用提供了更加多元、灵活的技术选择。据《南京日报》