DeepSeek 掀起低成本革命,这个国产大模型怎么兼顾高精度、低能耗?

2025-02-14 18:00:12

来源:光锥智能

图片来源:由无界AI生成

2025年开年,DeepSeek在国内外大模型行业掀起了地震。除了深度推理模型DeepSeek-R1在回答问题上的表现优异之外,DeepSeek的存在,给国内大模型圈注入了紧张又鲜活的空气。

其一,凭借技术优势,DeepSeek一举进入国际大模型头部梯队,这给国内大模型公司看到了弯道超车的可能性。

其二,DeepSeek的训练成果,打破了算力受限的问题,证明通过算法优化,同样可以以低算力训练出高质量的模型。

当算力“卡脖子”的隐忧被放下,兼顾能耗和精度的大模型应该解决哪些问题?在这个层面上,国内大模型公司纷纷交出了各自的答卷。

最近,由中国科学院自动化所孵化的AI企业中科闻歌发布的雅意大模型旗舰版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前给出了自己的答案。

作为覆盖全球100+模型的权威评测体系,OpenCompass榜单历来是观察大模型技术路线的"晴雨表",在其近日发布的OpenCompass大模型公开学术榜单中,中科闻歌YAYI-Ultra,以64.5分首次闯入前十,成为TOP10中五个中国大模型之一。

在OpenCompass最新大语言模型公开学术实时榜单中,YAYI-Ultra排名综合得分64.5,排名第十,其中:

代码生成:LiveCodeBench排名第五,表现优于GPT-4o-20241120版本

复杂指令理解:IFEval排名第九

知识推理能力:MMLU-Pro排名第九

在侧重中文理解的C-Eval评测中,YAYI-Ultra在允许自主验证的公开访问榜单位列第二,展现了在中文场景下的技术优势。

一手实测:超长文输出
复杂任务规划精准拿捏

根据官方信息,YAYI-Ultra在图表理解、复杂任务、长文理解与生成方面表现突出,我们立马上手从六个维度(多模态图表深度理解、复杂图像理解、复杂任务智能规划(Function Call)、数据统计分析及超长文本理解与生成)实测下YAYI-Ultra表现到底如何。

01 视觉理解再升级:懂语言,更懂图表

上来我们先来读个图表试试。

prompt:2000年前后,哪个价格区间的物业费占比变化最多?

#p#分页标题#e#

YAYI-Ultra可以准确识别柱状图中的不同颜色和数字,充分理解图表并给出回答。

除了中文场景外,在多语言场景中,YAYI-Ultra也能够准确理解并遵循用户指令,提供跨语言的精准回复。

prompt:How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。

可以看到,在视觉理解方面,针对跨语言多模态对齐、多图推理、可变分辨率等技术难点,YAYI-Ultra全面升级,增强了模型在跨语言图表理解、多图表问答、多模态指令遵循等方面的能力,不仅能轻松应对堆积条形图、散点图、混合图表等复杂图表场景,在图表重绘、图表转换等任务上也表现突出。

02 表格智解:万千表格不在话下

在工作中,复杂报告统计费时又费力,我们“喂”给YAYI-Ultra一张包含行业普通报告、行业深度报告、公司普通报告三种类型交替出现的表格,YAYI-Ultra准确统计出不同类型报告的数量。

prompt:每种报告类型的数量是多少?

当涉及不规则表格时,YAYI-Ultra依然能

声明:投资有风险,入市须谨慎。本资讯不作为投资建议。
本文链接: - 链补手