AI 技术创新,DeepSeek 之外的应用侧新叙事

2025-02-14 13:46:45

图片来源:由无界AI生成

2025年的春节假期刚刚过去,但是DeepSeek引发的冲击波仍然余温未散。

通过FP8训练、多词元预测、改良MOE架构、多头潜在注意力机制(MLA)、无SFT强化学习等方法,DeepSeek-V3以极低的训练成本实现了超越Qwen2.5-72B和Llama-3.1-405B等顶尖开源模型和部分闭源模型的性能,DeepSeek-R1更是表现出了超越OpenAI o1的推理效果。

DeepSeek系列模型的成功,为原来以算力为核心逻辑驱动的大模型行业开辟了新的道路,让全球的基础型大模型迈上了一个崭新的台阶。

然而,在DeepSeek等以“技术叙事”为主旋律的基础型大模型之外,还有一类大模型的研发进展值得关注,那就是围绕核心产品、核心场景进行AI技术创新的应用型大模型。

中国一直以来就是应用大国。

2024年,在算力供给逐渐跟上、推理价格大幅下降的大背景下,国产AI应用异军突起——无论是文生图、文生视频领域的即梦AI、妙鸭相机、快手可灵,还是AI搜索领域的纳米搜索(原360AI搜索)、天工AI搜索,还是AI陪伴领域的星野、猫箱,抑或是AI助手类的豆包、夸克、Kimi、通义等,都在2024年迎来了用户量的爆发。

这一个个AI应用,离不开背后模型能力的支撑。对AI应用来说,应用型大模型比拼的不是模型参数,而是应用效果。

例如此前Kimi之所以能够在短时间内获得较高的关注度,与其背后大模型的长文本读取和解析能力密不可分;夸克的2亿用户量和7000万月活得益于其背后夸克大模型的“用户友好”;可灵AI强大的文生视频、图生视频功能则依赖可灵大模型的支持。

基础型大模型的进化还远未到尽头,但随着2025年越来越多的公司开始布局AI应用,应用型大模型的发展将会是配合AI应用全面爆发的必要前提。

1.为什么大厂做AI应用更有优势

随着大模型技术的成熟与突破、算力基础设施的日渐完善、国家政策的持续加码、Sora/Suno等杀手级应用的不断涌现、AI Agent/具身智能/AI玩具/AI眼镜等领域投融资的强劲增长,2025年是AI应用的爆发年,几乎已经成为科技界的广泛共识。

并且这种共识还因DeepSeek的火爆而加速。因为DeepSeek将行业基础模型能力水位推高,给AI应用营造了一个更好的发展环境。

据「甲子光年」观察,2024下半年至今,高瓴资本、经纬创投、百度风投、英诺等知名投资机构加大了对于AI应用的投资力度,尤其是瞄准AI应用领域的早期项目下注;有投资人表示,截至2024年末,一级市场真实获得融资的AI应用项目数量,比实际公布出来的项目数量至少多两倍。#p#分页标题#e#

Sensor Tower数据也显示,2024年,全球手机用户在AI应用上的支出达到了12.7亿美元,AI相关的应用在iOS和谷歌Play商店中的下载量高达170亿次。

然而一个残酷的现实是,AI应用千千万,真正能维持长久运营的只是少数,能爆火的更是寥寥无几。

「甲子光年」就曾经报道过一个名为“AI墓地”的网站,里面收录了738个死亡或停止运行的AI应用,其中不乏一些曾经的明星项目:比如OpenAI推出的AI语音识别产品Whisper.ai,Stable Diffusion的知名套壳网站FreewayML、StockAI,以及曾被视为是“谷歌竞争者”的AI搜索引擎Neeva等(详见《AI墓地,和738个死去的AI项目 | 甲子光年》)。

那么,究竟什么样的AI应用才是能够长久运行下去的、有生命力的?

「甲子光年」认为,一是要以模型为核心,充分发挥模型的能力;二是要有足够强的用户需求洞察能力。

微软CEO萨提亚·纳德拉曾经在展望2025年AI行业趋势时表示,“以AI模型为核心的应用将在2025年重新定义各个应用领域”。也就是说,那些套壳层级越少、距离模型越近、越是最大限度发挥模型能力的应用,越能吸引用户的使用和停留。

观察新榜2025年1月的AI产品榜单不难发现,在国内榜单的前十名中,有8个都是直接建立在模型之上的、AI助手类的应用。

图源:新榜

而要对用户需求有足够强的洞察,则要依赖庞大的用户基础——只有拥有足够多的用户,用户数据和标签才能积累

声明:投资有风险,入市须谨慎。本资讯不作为投资建议。
本文链接: - 链补手