全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

首页 > AI资讯 > 最新资讯 > 全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

新火种 2024-08-21

8月2日消息，根据国内权威大模型评估平台OpenCompass（司南）近日公布的CompassArena周榜，GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。

OpenCompass的评测体系涵盖了学科、语言、知识、理解、推理等多个维度，能够全面评估大模型的综合能力。

在最新三期的评选中，讯飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

值得注意的是，科大讯飞在今年6月27日发布的星火V4.0版本上，已完成了对GPT-4 Turbo的整体超越。

根据八个国际主流测试集的横向评测，讯飞星火V4.0排名第一，在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。

此前，讯飞星火在《麻省理工科技评论》的横评中也获得了高分，凭借领先的语言能力、数学、理综等多项核心能力，斩获国产主流大模型榜首席位。

目前，讯飞星火的安卓端APP累计下载量已超过1.31亿次，位列国内工具类通用大模型APP第一，持续领跑国内大模型第一梯队。

Tags:

模型用户

2024-09-20

2024-09-20

2024-09-20

2024-09-20

2024-09-20

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。