电子报阅读机
2026-05-17
星期日
当前报纸名称:江苏商报

DeepSeek升级版强在哪

日期:04-29
字号:
版面:第A06版:观察       上一篇    下一篇

  通过技术上的硬核创新,DeepSeek-V4实现了“加量、提速、大降价”

  千呼万唤始出来!4月24日,DeepSeek(深度求索)宣布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

  这不是一次常规的模型迭代。DeepSeek表示,V4拥有百万字超长上下文,在Agent(智能体)能力、世界知识和推理性能上均实现国内与开源领域的领先,并且相比于传统方法大幅降低了对计算和显存的需求,由此迈入百万字上下文普惠时代。

  对于普通用户而言,DeepSeek升级版到底强在哪?如果你将问题抛给DeepSeek-V4,它的回答是:“加量、提速、大降价。”

  全面升级,一次性处理《三体》三部曲的长文本

  这几天,用户打开DeepSeek,会出现以下提示:DeepSeek-V4预览版发布,具备世界顶级推理性能,Agent能力大幅提高。用户只需要登录DeepSeek官网或官方App,就可以免费体验最新的DeepSeek-V4。

  据了解,DeepSeek-V4推出两个版本:高性能的“Pro版”和高性价比的“Flash版”,分别对应目前官方网页端、App界面的专家模式和快速模式。那么,相比前代模型,V4增加了哪些技能点?DeepSeek-V4给出了以下回答:

  在上下文长度方面,以前版本较短,处理长内容容易“断片”;新版本标配100万token(词元),用户一口气读完《三体》三部曲还绰绰有余。以前让AI读长篇报告、几十页合同或整本书,它可能会忘记前面的内容。现在V4的“记性”比较好,用户再也不用把长文分段“喂”给它,直接一次全输入过去,它也能抓住所有细节。

  在核心能力方面,新版本对于长文本理解和Agent能力大幅增强,能处理复杂的工作流、代码任务和文档分析。比如自动在代码库里找漏洞,根据用户要求生成一份完整的汇报PPT等。

  在技术架构方面,此前版本是传统注意力机制,V4创新采用注意力压缩技术,让模型处理长文时,计算量降至原来的27%,显存占用降至10%,效率极高。

  在价格方面,新版本把AI大模型的使用成本拉到“白菜价”。V4-Flash版每百万token输入价格1元,输出价格2元。如果内容能命中缓存(可以理解为AI记住了用户之前提过的东西),输入价格低至0.2元。V4-Pro版每百万token输入价格为12元,输出价格为24元,价格只有海外顶级模型的14%~35%。

  对此,DeepSeek-V4总结道:通过技术上的硬核创新,V4实现了“加量、提速、大降价”的全面升级,一个好用又不贵的AI时代越来越近。

  协同作战,“用国产算力跑国产模型”

  去年初,DeepSeek横空出世,以高性能和低训练成本的开源模型能力让全球AI(人工智能)圈为之震动,迎来“DeepSeek时刻”。

  对于DeepSeek-V4预览版本此次上线,虽然圈内仍然给予极高关注,但用户端已经少了一年多前的兴奋与沸腾。

  “毕竟现在市面上涌现了不少国产大模型,大家在调用工具时,并不会完全依赖DeepSeek。”多位用户表示,在智能体越来越深入人心的当下,DeepSeek-V4仍然是一个纯文本模型,并不具备多模态识别能力,让人略感遗憾。

  事实上,此次V4最受瞩目的,是首次在官方技术报告中,把国产芯片和英伟达GPU写进同一份硬件验证清单。

  其技术报告中明确指出:“我们验证了细粒度EP(专家并行)方案在英伟达GPU(图形处理器)和华为昇腾NPU(嵌入式神经网络处理器)双平台上的表现。”

  EP方案是一种专门为MoE(混合专家模型)架构设计的分布式推理策略。这意味着,DeepSeek正在尝试使用国产算力做推理。

  不仅如此,DeepSeek在发布中明确表示,受限于高端算力,V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,V4-Pro的价格会大幅下调。

  4月24日,华为也发文称,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。“用国产算力跑国产模型”,中国AI产业正在从“单点突破”走向“体系作战”。

  延伸阅读

  南京市政务大模型平台在全省率先完成DeepSeekV4部署

  依托全市统一的政务云环境和国产AI算力资源池,南京在江苏省率先于政务外网环境完成DeepSeek-V4私有化部署,提供了安全可靠的DeepSeek-V4使用环境。

  今年4月24日,全球AI领域备受瞩目的DeepSeek-V4正式开源发布,这一国产大模型的重大进展,为政务智能化应用提供了更强大的技术底座。

  南京市城市数字治理中心(市数治中心)敏锐把握技术前沿,立即启动部署工作。目前,DeepSeek-V4已通过南京市政务大模型(MaaS)平台向全市各部门开放申请使用。各部门可通过平台便捷调用DeepSeek-V4的强大能力,快速构建各类政务智能应用,如政策咨询智能体、文档智能处理、数据分析与报告生成等。

  为进一步丰富南京政务大模型能力生态,MaaS平台还同步上线了Qwen3.5及MiniMax2.7两款国内头部开源大模型。至此,南京市政务大模型平台已汇聚DeepSeek、Qwen、MiniMax等多款领先国产大模型,为各部门开展“人工智能+政务”场景应用提供了更加多元、灵活的技术选择。据《南京日报》