中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首

发布时间:2025-05-31 来源:互联网

腾讯科技最新发布了8月份的SuperCLUE-V基准榜单,这次测评涵盖了多模态理解领域的12个顶尖模型。

IT之家 8 月 5 日消息,据腾讯科技今日报道,中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型位居国内大模型首位(71.95 分)。

腾讯科技方面宣称,该模型准确识别图像元素并生成自然语言描述,全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型,腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。

IT之家查询得知,8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二,仅次于 GPT-4o。GPT-4o 取得 74.36 分,领跑多模态基准,基础多模态认知能力和应用能力均有 70 + 分的表现,在技术和应用方面均有一定领先优势。

中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首

▲ 图源“ CLUE 中文语言理解测评基准”公众号,下同

中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首

SuperCLUE 评价称,在基础能力方面,国内大模型较海外模型仍有一定差距,尤其在细粒度视觉认知任务上,国内外最好模型有 5 分的差距,需要进一步对多模态深度认知能力做优化提升。

本次测评选取了 4 个海外模型和 8 个国内代表性多模态模型。其中为进一步评估开源和闭源的不同进展,本次参评模型包括 4 个开源模型、8 个闭源模型。

中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首

总体来看,本次评测展示了腾讯混元在多模态基准上的卓越表现,但也凸显了国内模型在特定视觉认知任务上与国外模型的差距。

本周热门教程

1
SamAltman:若不建立足够的基础设施,AI将引发战争成为富人工具

SamAltman:若不建立足够的基础设施,AI将引发战争成为富人工具

2025/05/01

2
苹果新品发布会:iPhone16隆重登场为人工智能而生

苹果新品发布会:iPhone16隆重登场为人工智能而生

2025/05/07

3
AI眼镜赛道热度飙升,国内外企业争相入局

AI眼镜赛道热度飙升,国内外企业争相入局

2025/01/03

4
AI遇上化学:“不可能”变为“可能”

AI遇上化学:“不可能”变为“可能”

2025/01/07

5
专家:AI时代,人类独有的特质都将迎来价值重估

专家:AI时代,人类独有的特质都将迎来价值重估

2025/01/08

6
量子位智库:国内AI应用首轮洗牌结束仍存未解难题

量子位智库:国内AI应用首轮洗牌结束仍存未解难题

2025/01/22

7
AI觉醒!人工智能学会隐藏复制自己了?

AI觉醒!人工智能学会隐藏复制自己了?

2025/01/26

8
8岁孩子也能编程!4名MIT本科生打造的AI“神器”,年化收入达6500万美元,公司员工仅12人

8岁孩子也能编程!4名MIT本科生打造的AI“神器”,年化收入达6500万美元,公司员工仅12人

2025/01/30

9
2024领先科技奖之声|微软Copilot:新一代人工智能副驾驶

2024领先科技奖之声|微软Copilot:新一代人工智能副驾驶

2025/01/31

10
一个半月可理解50年的视频量视频AI工具InstMind发布

一个半月可理解50年的视频量视频AI工具InstMind发布

2025/01/31