DeepSeek 掀起低成本革命，这个国产大模型怎么兼顾高精度、低能耗？_-链补手 | 致⼒于为投资者和区块链创业者提供更好的信息服务。

DeepSeek 掀起低成本革命，这个国产大模型怎么兼顾高精度、低能耗？

2025-02-14 18:00:12

来源：光锥智能

图片来源：由无界AI生成

2025年开年，DeepSeek在国内外大模型行业掀起了地震。除了深度推理模型DeepSeek-R1在回答问题上的表现优异之外，DeepSeek的存在，给国内大模型圈注入了紧张又鲜活的空气。

其一，凭借技术优势，DeepSeek一举进入国际大模型头部梯队，这给国内大模型公司看到了弯道超车的可能性。

其二，DeepSeek的训练成果，打破了算力受限的问题，证明通过算法优化，同样可以以低算力训练出高质量的模型。

当算力“卡脖子”的隐忧被放下，兼顾能耗和精度的大模型应该解决哪些问题？在这个层面上，国内大模型公司纷纷交出了各自的答卷。

最近，由中国科学院自动化所孵化的AI企业中科闻歌发布的雅意大模型旗舰版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前给出了自己的答案。

作为覆盖全球100+模型的权威评测体系，OpenCompass榜单历来是观察大模型技术路线的"晴雨表"，在其近日发布的OpenCompass大模型公开学术榜单中，中科闻歌YAYI-Ultra，以64.5分首次闯入前十，成为TOP10中五个中国大模型之一。

在OpenCompass最新大语言模型公开学术实时榜单中，YAYI-Ultra排名综合得分64.5，排名第十，其中：

代码生成：LiveCodeBench排名第五，表现优于GPT-4o-20241120版本

复杂指令理解：IFEval排名第九

知识推理能力：MMLU-Pro排名第九

在侧重中文理解的C-Eval评测中，YAYI-Ultra在允许自主验证的公开访问榜单位列第二，展现了在中文场景下的技术优势。

一手实测：超长文输出
复杂任务规划精准拿捏

根据官方信息，YAYI-Ultra在图表理解、复杂任务、长文理解与生成方面表现突出，我们立马上手从六个维度（多模态图表深度理解、复杂图像理解、复杂任务智能规划（Function Call）、数据统计分析及超长文本理解与生成）实测下YAYI-Ultra表现到底如何。

01 视觉理解再升级：懂语言，更懂图表

上来我们先来读个图表试试。

prompt：2000年前后，哪个价格区间的物业费占比变化最多？

#p#分页标题#e#

YAYI-Ultra可以准确识别柱状图中的不同颜色和数字，充分理解图表并给出回答。

除了中文场景外，在多语言场景中，YAYI-Ultra也能够准确理解并遵循用户指令，提供跨语言的精准回复。

prompt：How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。

可以看到，在视觉理解方面，针对跨语言多模态对齐、多图推理、可变分辨率等技术难点，YAYI-Ultra全面升级，增强了模型在跨语言图表理解、多图表问答、多模态指令遵循等方面的能力，不仅能轻松应对堆积条形图、散点图、混合图表等复杂图表场景，在图表重绘、图表转换等任务上也表现突出。

02 表格智解：万千表格不在话下

在工作中，复杂报告统计费时又费力，我们“喂”给YAYI-Ultra一张包含行业普通报告、行业深度报告、公司普通报告三种类型交替出现的表格，YAYI-Ultra准确统计出不同类型报告的数量。

prompt：每种报告类型的数量是多少？

当涉及不规则表格时，YAYI-Ultra依然能

声明：投资有风险，入市须谨慎。本资讯不作为投资建议。
本文链接： - 链补手