DeepSeek 荣光下：落寞的“六小龙”_-链补手 | 致⼒于为投资者和区块链创业者提供更好的信息服务。

DeepSeek 荣光下：落寞的“六小龙”

2025-02-25 17:04:45

作者：吴芊语

人类的悲欢并不相通。从2016年开启的人工智能元年，AI产业已经历好几轮洗牌，借着ChatGPT的东风，DeepSeek如同鲇鱼一般搅动了整个大模型市场，同为大模型创业公司并被业界视为新贵“六小龙”的厂商们，与其相比，境遇堪称东边日出西边雨。

DeepSeek年前推出低成本、性能媲美GPT-4o的DeepSeek-V3震惊业界后，其接着在1月20日发布R1模型，上线六天后登顶苹果App Store全球下载榜首，上线一个月累计下载量超1.1亿次。在这期间各大云厂商迅速上线开源版V3和R1，百度搜索、微信等产品都在积极拥抱DeepSeek。

而和DeepSeek同时期发布的Kimi全球强化学习模型k1.5、阶跃推理模型Step R-mini，在模型能力上诸多层面接近o1，但依然淹没在了DeepSeek火爆的舆论中。

与DeepSeek的喧闹相比，“六小龙”也是接二连三的爆出消息：零一万物进一步拆分、月之暗面预算和仲裁案未和解、MIniMax又一高管离职……

而这背后还有失意的VC们：真金白银支持的项目，没有一个达到DeepSeek这样的热度。目前，“六小龙”中已经4家超半年没有融资消息释放。2024年业界称“六小龙”中已有两家掉队，2025年，下一个掉队的是谁？

只剩三家继续扎根大模型

DeepSeek的爆火并非没有征兆，自2023年11月2日推出首个模型DeepSeek Coder后，一年多时间上线了超10个不同版本的模型。其中去年5月发布的V2模型，性能上比肩GPT-4 Turbo，价格却只有GPT-4的1%，因此DeepSeek被称作“价格屠夫”“AI界拼多多”，同时掀起了大模型行业的第一轮价格战。

2025年1月27日DeepSeek超越ChatGPT，登顶中国区和美国区苹果APP Store免费榜，引发全球关注。让DeepSeek有如此成就的是其推理大模型DeepSeek-R1。根据DeepSeek公布的信息，R1在多项权威测试中得分与o1正式版接近，部分测试中得分还超过o1正式版。

榜单评分外，开源+性价比则是让DeepSeek引发泼天热度的重要组合拳。受到DeepSeek的冲击，曾经的闭源信徒百度创始人李彦宏也宣布加入开源队伍，OpenAI创始人山姆.奥特曼也反思道，公司在开源领域的策略上一直处于“错误的一方”。

大模型“六小龙”中的MiniMax在1月15日发布了首个开源模型，其创始人闫俊杰在接受《晚点》采访时也表示，“第一次创业很多经验不具备，如果可以重新选，应该第一天就开源。”其他五小龙中，只有智谱是最早开源闭源两条腿走路的。经过近两年的摸爬滚打后，“六小龙”发展方向已南辕北辙。

零一万物是第一家公开大幅调整的基础大模型公司，先是裁撤了预训练算法团队和Infra团队，部分人员以跳槽形式加入阿里，后宣布与阿里云、苏州高新区分别联合成立产业大模型联合实验室、产业大模型基地。#p#分页标题#e#

人员方面，模型训练负责人黄文灏、负责大模型API开放平台的蓝雨川、生产力产品负责人曹大鹏都相继离职。试图留在牌桌上的零一万物，掩盖不住在这一轮大模型竞赛中的颓势。

百川智能则在2024年明确了走医疗赛道，近期上线了首个“AI儿科医生”。在To B的商业化上百川则似乎不太顺利，其联合创始人、商业化负责人洪涛年前已经离职。据百川一位员工告知的确不及预期，“现在有了DeepSeek后，今年的压力只增不减。”

To B商业化负责人离职的还有MiniMax的魏伟，此前魏伟接受采访时表示，很多B端客户不会轻易掏这个钱，去支撑大模型公司的营收，只能基于研发能力、算法能力来帮助客户在实际场景中对齐输出效果，也印证了大模型商业化并非易事。

如此看来，仍在专注于大模型技术创新和追求AGI的，仅剩下月之暗面、智谱、阶跃星辰。受到DeepSeek的影响，阶跃星辰也加入了开源阵营，只是与DeepSeek重点在文本模型上不同的是，阶跃星辰最新开源的是两款多模态模型——Step-Video-T2V、Step-Audio。

2月23日凌晨，月之暗面发布最新论文《Muon is Scalable for LLM Training》，并开源MoE模型Moonlight，模型激活参数仅需3B。不少业内人士认为这是在“截胡开源周”，因为早前DeepSeek宣布将连续5天发布开源项目。

对月之暗面而言，火烧眉毛的或许是其大手笔投流的Kimi产品。

烧钱投流难成榜一大哥

与大模型“六小龙”一样DeepSe

声明：投资有风险，入市须谨慎。本资讯不作为投资建议。
本文链接： - 链补手