DeepSeek 上线超算互联网,将普惠 AI 进行到底

2025-02-17 18:00:21

这个春节,DeepSeek可谓大红大紫,其 V3和R1等诸多版本的开源,让先进AI模型不再是海外巨头和少数人才能接触到的黑科技,先进AI模型的高岭之花,被DeepSeek摘下,成为全民普惠的AI技术。

而基于DeepSeek的行业智能化,则离不开海量算力的便捷供给,而诸如国家超算互联网等先进算力服务平台,则让“先进模型+强劲算力”的组合形成,并促使更多AI应用创新出现。

近日,国家超算互联网平台快速上线了包括R1满血版的DeepSeek全家桶模型,并提供快速部署API调用及AI web应用服务,助力企业和开发者灵活构建专属AI应用。

先进算法模型与普惠的超智融合算力,正将AI变成水电气一样的基础设施。一场加速推进普惠AI应用落地的新技术运动,正在全国拉开序幕。

全民DeepSeek的AI普惠时代,需要我们去读懂、去探索、去深拥。而理解普惠AI的第一步,就是搞懂为什么强大模型与超智融合算力,曾是普通人眼中的高岭之花。

没有千行百业的智能化,就没有整个中国的智能化。所谓AI普惠,就是各行各业都能充沛、低成本地接入先进AI算法与融合算力。

这就需要两种AI基本要素的下沉:

一是先进模型的下沉。

此前,OpenAI o1/o3这类推理模型,就是算法领域的高岭之花,订阅费高昂,普通人很难用上,且不向国内开放服务。而2025开年以来,DeepSeek通过混合专家模型(MoE)和多头潜在注意力机制(MLA)等技术突破,以及强化学习训练方法的创新,让模型训练成本大幅降低。DeepSeek R1对算法架构、权重等进行了完全开源,打破海外对先进推理模型的垄断,支持中小企业低成本接入高性能AI。

另一个是超智融合算力资源的下沉。

DeepSeek的性能高,单一模型训练的算力需求降低。但千行百业引入DeepSeek升级智能化,会导致AI模型和应用总量的攀升。就像杰文斯悖论(Jevons Paradox)所说的,当使用某种资源的效率提高时,该资源的总消耗量反而可能会增加,而不是减少。

像DeepSeek这样由技术创新提升效率的生产力工具,其广泛应用将大规模带动算力需求的增加。而放眼目前国内算力格局,GPU为主的AI专用算力价格昂贵,且资源紧缺,无法支撑千行百业智能化的算力需求。

这时候,以超级计算机为主的融合算力集群,可提供澎湃的算力保障,满足大模型训练推理及行业大规模应用的算力需求。#p#分页标题#e#

因此,减少各行各业引入AI的算力荒与成本负担,超智融合算力的下沉与普惠,势在必行。这时候,新的挑战又出现了。

长期以来,超算被看作计算领域的高岭之花,普通企业和开发者想用,并不容易。其挑战主要来自几方面:

一是能力,用好多元异构融合算力,与AI任务相适配来充分释放性能,需要具备一定的研发和工程化能力,这超出了许多企业和开发者的能力边际。

二是效率,AI任务大规模、高并发与稳定可靠等需求,高度依赖于多集群、多中心的协同。这涉及跨中心资源统筹、算间互联、算网互联等综合能力,全面考验着算力平台的高效运行管理能力。

三是服务,AI开发运行到商业变现,环节多、流程长,支撑Agent、垂类模型、应用等的开发,需要完善的工具链和生态支持,这要求平台从卖铲子的转变为服务者,是很多传统数据中心的运营方还没有转型。

行业智能的繁荣,先进算法和超算算力缺一不可。依托超算互联网背后的全国多地超算、智算中心的海量资源就成为必选项。DeepSeek让企业和开发者实现了模型普惠,谁能为行业摘下超算的高岭之花?国家超算互联网平台出手了。

在DeepSeek爆火,服务器频繁宕机的关键时刻,国家超算互联网平台出手,2月3日发布了DeepSeek-R1、V3、Coder等系列模型和Chatbot服务。上线首日点

声明:投资有风险,入市须谨慎。本资讯不作为投资建议。
本文链接: - 链补手