“AI届拼多多” DeepSeek 到底牛在哪儿？

日期：02-05

字号：大 中 小

版面：第12版：新知上一篇 下一篇

最近，中国的AI工具DeepSeek横空出世，在全球迅速爆红，成为当前科技和财经等领域最受关注的话题。几天之内，DeepSeek在美国应用商店的下载排名高居第一，超越了AI届的头号老大ChatGPT。很多人认为，DeepSeek出圈的原因之一是，它采用“更聪明”的算法，把AI训练成本砍掉近60%，却实现甚至超越了同类模型的性能。但实际上，这个带有“神秘的东方力量”的AI工具，厉害的地方还不止于此。以低成本实现最顶尖性能 DeepSeek全称“杭州深度求索人工智能基础技术研究有限公司”（下文称中国深度求索公司），成立于2023年7月，由量化资管巨头幻方量化创立，创始人梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验。 DeepSeek是一款大型语言模型。它拥有强大的自然语言处理能力，就像是一个聪明又懂你的助手，能够像朋友一样理解并回答问题。根据其背后的算法和数据支持，还能帮助你写代码、整理资料，甚至解决一些复杂的数学问题。提到类似的大模型，大家的第一印象或是OpenAI开发的ChatGPT。从2024年9月OpenAI发布o1-preview到现在，仅仅过去不到四个月，市场上媲美甚至超越其性能的推理模型遍地开花。 DeepSeek之所以在全球刮起一阵强烈旋风，首先是因为好用。按照全球主流机构的测评，DeepSeek在很多方面的表现和chatGPT的表现不相上下，在中文领域，DeepSeek的表现甚至更胜一筹。用中文向DeepSeek提问，DeepSeek可以给出非常深度的回答，完全没有模棱两可的“一眼AI式感觉”。而更让人吃惊的是，DeepSeek以极低的成本实现了最顶尖的性能。按照DeepSeek披露的数据，其训练成本只有558万美元。和美国ChatGPT等主流AI相比，成本还不到1/10，这才是DeepSeek最具颠覆性的地方。在DeepSeek面世之前，人们普遍认为AI是一个极其消耗算力的产业，所以，在这一轮AI热潮里，英伟达成为最大赢家，全球AI公司都要大批量采购英伟达的先进芯片。过去两年时间，英伟达的股票狂涨10倍，超越苹果、亚马逊和特斯拉等等，成为全球市值最高的公司。但是，DeepSeek的横空出世改变了游戏规则。因为受到美国芯片出口管制的影响，DeepSeek只能使用英伟达性能相对较低的芯片，结果正是在这样的背景下，DeepSeek通过算法创新、提升硬件利用效率等方式，反而用极少的算力消耗就实现了AI性能的飞跃。DeepSeek的表现打破了AI对于算力高需求的神话，引发了整个AI产业链的价值重估，在DeepSeek的冲击下，当前全球最炙手可热的英伟达应声落地，1月28日，英伟达的股价暴跌17%。市场分析师认为，DeepSeek的模型推出如同一颗“震撼弹”，令市场对美国科技行业的竞争力产生疑虑，导致人工智能主题股票遭抛售。中国技术理想主义的体现 DeepSeek对AI的冲击还不止于此。作为一家中国公司，DeepSeek表现出了前所未有的自信，对产品实施开源策略，也就是公开模型的代码和架构等等，允许公众查看、使用和修改。这就意味着，很多中小企业可以直接使用其模型，极大降低了很多企业的研发成本。相比之下，OpenAI和谷歌等旗下的AI产品都是闭源，DeepSeek的开源和低价策略，对于国际上那些依靠高收费的主流AI工具，也将带来巨大冲击。正因为如此，DeepSeek也有了“AI届的拼多多”之称，这种表述可能并不完全准确，但也基本表达了DeepSeek对当前主流AI的冲击。 DeepSeek全球爆红，背后的实际推动者并不是人们耳熟能详的互联网大厂，而是一家并不算太知名的基金公司——幻方量化。2015年，毕业于浙江大学电子信息工程专业的梁文峰创办了幻方量化基金公司。和传统基金公司不同的是，量化投资不靠人力来做买卖抉择，而是在大数据基础上，依靠人工智能来买卖股票。量化投资的优势在于，通过计算机收集市场上的海量信息，并迅速抓住其中瞬息万变的套利机会，然后以高频交易将获利空间放大。量化投资以计算机来控制买卖行为，达到买点或者卖点就自动交易，这种决策模式杜绝了人性的波动心理。梁文峰的量化投资表现出色，成立仅仅6年，基金规模就突破了1000亿元。以人工智能做投资的背景，也让梁文峰进军AI届显得顺理成章。由于量化投资规模越来越大，复杂的模型计算开始面临算力瓶颈，梁文峰的团队开始寻求大规模算力解决方案，为后来推出DeepSeek奠定了基础。在基金公司赚取的利润支撑下，梁文峰开始大量采购英伟达的芯片，一家基金公司囤积了超过1万张芯片，比国内很多互联网大厂还多，这也让幻方量化的投资人开始质疑公司“不务正业”。事实上，在全球AI爆发的前夜，梁文峰的确开始转型了。一方面收缩投资业务，主动缩减资金规模，2025年初，公司资金管理规模已小于300亿，不再处于量化投资的头部。与此同时，公司加速向AI转型。2023年5月，梁文峰成立了“深度求索”，2024年DeepSeek正式上线，2025年年初，DeepSeek全球爆红。 DeepSeek的成功被一些人视为中国技术理想主义的体现，甚至被外国人比喻为神秘的东方力量。但从整个AI大模型产业来看，DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。（本报综合）

“AI届拼多多” DeepSeek 到底牛在哪儿？

日期：02-05 字号：大中小 版面：第12版：新知 上一篇 下一篇

日期：02-05

字号：大中小

版面：第12版：新知上一篇下一篇