DeepSeek的「鲶鱼效应」
作者|Tim 来源|潮汐商业评论(ID:daily-case)
蛇年前夕,DeepSeek犹如一颗“原子弹”般震撼了全球人工智能领域。
这款主打“极致性价比”的大语言模型,不仅在性能上比肩OpenAI的顶尖模型o1,其成本更是仅为GPT-4o的十分之一,API调用成本更是低至OpenAI的三十分之一。
这证明了AI企业依靠烧钱卷“投流”“获客”的路径不可行,更凸显了长期主义地原始创新和低成本研发的重要性。
这也打破了技术闭源的OpenAI和英伟达的市场垄断,更引发了全球科技巨头的股价波动,英伟达市值一夜之间蒸发4.3万亿元。
目前,DeepSeek累计用户已经超过了1.25亿。它像鲶鱼一样,搅动全球人工智能领域,让国内AI基建重拾信心,被称为“国运”级别的存在。
一
新路径弯道抢跑
AI大模型是一个重资产行业,2024年Scaling Law仍未失效,随着模型不断变大,训练新模型需要更多的数据、更多的算力。
这意味着需要充足的资金支撑。一位大厂高层给出判断,做大模型,“一年低消也要20亿-30亿美元”。
DeepSeek的出现,证明了AI企业依靠烧钱卷“投流”“获客”的路径是不可行的,以往中国AI大模型“卷”算力、“卷”价格、“卷”获客、“卷”变现能力,如今人们更认可长期主义的原始创新,企业应当思考架构创新和低成本研发,而不是一味烧钱。
在过去的2024年,月之暗面的Kimi和字节跳动的豆包轮番成为大众追捧的AI应用。它们背后是重金推广和疯狂卷算力。
以抖音为例,2024年字节跳动才开始在大模型上发力,凭借此前的火山云基础设施和人才团队积累,以及大规模资金投入和四处挖人。在互联网四巨头里,字节跳动在AI领域的投入上高达800亿人民币,远超腾讯、阿里、百度。
字节跳动旗下火山引擎支持多芯、多云架构,拥有超大规模算力,支持万卡集群组网、万亿参数MoE大模型;提供超高性能网络,支持3.2TbpsRDMA网络,全球网络POP覆盖广,时延优化最高达75%,在算力资源上优势也很明显。
DeepSeek的出现推动了AI技术更加普及和高效,其崛起将推动小型化模型即边缘AI的推广,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向。
二
与友商们都“交个朋友”
DeepSeek解决了国产AI领域的困局,应用的落地,激活了整个行业。国产芯片、软硬件公司、云厂商纷纷接入DeepSeek“交个朋友”。
大模型企业们对于算力的需求不断攀升,对于云服务的需求提升明显。腾讯云、阿里云、华为云、百度智能云、火山引擎等数十家云计算服务龙头,拆掉了围墙,都推出限时优惠、包年包月等选项。
在芯片领域,华为昇腾、沐曦科技、摩尔线程、壁仞科技等10多家国产AI芯片企业,都表示适配了DeepSeek原版或“蒸馏”后的小尺寸版本。
同时,国产手机品牌和新能源汽车品牌也纷纷接入DeepSeek。
另外,DeepSeek也刺激了阿里云通义团队发布旗舰模型“Qwen2.5-Max”,成为第二家可以比肩美国OpenAI公司o1系列的国产大语言模型,让行业内外为之振奋。
DeepSeek的效应还在持续,将吸引以华为为代表(还包括寒武纪、海光、摩尔线程等)的国产算力厂商会投入更大资源支持国产大模型的适配,政府资源的支持力度也会加大,这有利于国内人工智能的产业链更好发展。
同时也会加剧竞争,头部优势厂商变强,一批原先瞄准通用大模型为目标的创业公司和互联网公司将因为资源无法支撑而退出角逐,转而做特定方向的人工智能应用落地,这有助于我们国内人工智能产业资源的更合理分布。
DeepSeek验证的长思维链模式,有助于整个产业链降低在数据推理路径标注的投入,未来大模型在需要复杂推理的应用落地过程会进一步加快。
从DeepSeek的推出到应用端铺开布局,再到投资者重新理解中国科技企业的技术潜力、对科技股价值重估,这种转换让人炫目。DeepSeek“国运”系身一点都不夸张。
三
国产大模型有了新奔头
DeepSeek的爆火出圈,也让美国和欧洲看到,中国在大模型产业已经形成一批颇具实力和影响力的公司,其中有字节跳动、阿里、腾讯等大厂身影,也有月之暗面、智谱、MiniMax等初创企业。
客观来讲,国内无论是DeepSeek V3/R1、讯飞星火X1,还是字节的豆包、阿里的通义千问等国产大模型,目前和OpenAI的o3相比在现实物理规律的理解和运用、超复杂科学问题的求解、多模态视频流输入理解等高难度任务上还是有差距。
通用人工智能也不仅局限于此,在多模态大模型、具身智能、世界模型、环境模拟器等多个方面,中国的人工智能都有可挖掘的巨大空间,尤其是在高制程人工智能芯片的量产和演进能力方面。
当然,中国人工智能还是会面临一些挑战。
DeepSeek基于以英伟达算力取得的如此大的成就,势必会引发海外针对芯片供应的封锁手段不断升级,给国产大模型的发展带来更多限制。
尤其是美国大概率会对我国的英伟达算力获取和国产算力海外投片采取更严苛的限制措施,H800、A100、H20等卡将会被全面禁止,给DeepSeek带来的限制将日益增多。
所以实现国产算力的自主可控将更为关键。幸运的是,国产所有大模型中已经有一家公司凭借国产算力做出了成绩。
讯飞星火大模型的训练和推理都在国产算力上进行的,并且仅用了1万张910B国产算力卡。科大讯飞不仅用比友商少数倍的算力取得了大模型研发上的一些成果,而且还做了大量国产算力平台上的无人区的适配和效率优化,可以说是真正把国产算力做到了极致效率,这比在英伟达上的实现更需要技术实力和勇气,也更具有战略意义。
如果讯飞星火能取得成功,将会像DeepSeek一样,给予了我国同行们比以往更有信心和勇气做底层的技术创新。
从这个角度上看,DeepSeek也只是为2025年中国人工智能拉开了大幕,真正的爆发正在迎面赶来。
潮汐编辑部的Jesse最近两周已经习惯了在成稿后来一场“人机对话”,以期获得些意外的观点。这次当她把问题输入,只见对话框旋转半天后,DeepSeek弹出了一行字:“服务器繁忙,请稍后再试。”
DeepSeek以“白菜价”技术打破垄断,用开源生态凝聚产业链,最终引爆了国内AI从技术到商业的全面升级。可这一切都来的太快了,烈火烹油,总要给Deepseek和整个AI行业一点时间适应。
正如DeepSeek创始人梁文锋在采访中所说,“以后硬核创新会越来越多。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。”
你看,商业就是这样。
编者按:本文转载自微信公众号:潮汐商业评论(ID:daily-case),作者:Tim
品牌、内容合作请点这里:寻求合作 ››
前瞻经济学人
专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。