DeepSeek升级版强在哪

日期：04-29

字号：大 中 小

版面：第A06版：观察上一篇 下一篇

　　通过技术上的硬核创新，DeepSeek-V4实现了“加量、提速、大降价”

　　千呼万唤始出来！4月24日，DeepSeek（深度求索）宣布，全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

　　这不是一次常规的模型迭代。DeepSeek表示，V4拥有百万字超长上下文，在Agent（智能体）能力、世界知识和推理性能上均实现国内与开源领域的领先，并且相比于传统方法大幅降低了对计算和显存的需求，由此迈入百万字上下文普惠时代。

　　对于普通用户而言，DeepSeek升级版到底强在哪？如果你将问题抛给DeepSeek-V4，它的回答是：“加量、提速、大降价。”

　　全面升级，一次性处理《三体》三部曲的长文本

　　这几天，用户打开DeepSeek，会出现以下提示：DeepSeek-V4预览版发布，具备世界顶级推理性能，Agent能力大幅提高。用户只需要登录DeepSeek官网或官方App，就可以免费体验最新的DeepSeek-V4。

　　据了解，DeepSeek-V4推出两个版本：高性能的“Pro版”和高性价比的“Flash版”，分别对应目前官方网页端、App界面的专家模式和快速模式。那么，相比前代模型，V4增加了哪些技能点？DeepSeek-V4给出了以下回答：

　　在上下文长度方面，以前版本较短，处理长内容容易“断片”；新版本标配100万token（词元），用户一口气读完《三体》三部曲还绰绰有余。以前让AI读长篇报告、几十页合同或整本书，它可能会忘记前面的内容。现在V4的“记性”比较好，用户再也不用把长文分段“喂”给它，直接一次全输入过去，它也能抓住所有细节。

　　在核心能力方面，新版本对于长文本理解和Agent能力大幅增强，能处理复杂的工作流、代码任务和文档分析。比如自动在代码库里找漏洞，根据用户要求生成一份完整的汇报PPT等。

　　在技术架构方面，此前版本是传统注意力机制，V4创新采用注意力压缩技术，让模型处理长文时，计算量降至原来的27%，显存占用降至10%，效率极高。

　　在价格方面，新版本把AI大模型的使用成本拉到“白菜价”。V4-Flash版每百万token输入价格1元，输出价格2元。如果内容能命中缓存（可以理解为AI记住了用户之前提过的东西），输入价格低至0.2元。V4-Pro版每百万token输入价格为12元，输出价格为24元，价格只有海外顶级模型的14%~35%。

　　对此，DeepSeek-V4总结道：通过技术上的硬核创新，V4实现了“加量、提速、大降价”的全面升级，一个好用又不贵的AI时代越来越近。

　　协同作战，“用国产算力跑国产模型”

　　去年初，DeepSeek横空出世，以高性能和低训练成本的开源模型能力让全球AI（人工智能）圈为之震动，迎来“DeepSeek时刻”。

　　对于DeepSeek-V4预览版本此次上线，虽然圈内仍然给予极高关注，但用户端已经少了一年多前的兴奋与沸腾。

　　“毕竟现在市面上涌现了不少国产大模型，大家在调用工具时，并不会完全依赖DeepSeek。”多位用户表示，在智能体越来越深入人心的当下，DeepSeek-V4仍然是一个纯文本模型，并不具备多模态识别能力，让人略感遗憾。

　　事实上，此次V4最受瞩目的，是首次在官方技术报告中，把国产芯片和英伟达GPU写进同一份硬件验证清单。

　　其技术报告中明确指出：“我们验证了细粒度EP（专家并行）方案在英伟达GPU（图形处理器）和华为昇腾NPU（嵌入式神经网络处理器）双平台上的表现。”

　　EP方案是一种专门为MoE（混合专家模型）架构设计的分布式推理策略。这意味着，DeepSeek正在尝试使用国产算力做推理。

　　不仅如此，DeepSeek在发布中明确表示，受限于高端算力，V4-Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，V4-Pro的价格会大幅下调。

　　4月24日，华为也发文称，昇腾一直同步支持DeepSeek系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。“用国产算力跑国产模型”，中国AI产业正在从“单点突破”走向“体系作战”。

DeepSeek升级版强在哪

日期：04-29 字号：大中小 版面：第A06版：观察 上一篇 下一篇

日期：04-29

字号：大中小

版面：第A06版：观察上一篇下一篇