竞技场

首页 > 竞技场

逆水寒推出“AI竞技场”：邀1亿玩家参与AI模型评估

【CNMO科技消息】近日，国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能，这一创新举措旨在通过游戏平台，汇聚广大玩家力量，对当下热门的AI大模型进行客观评估。据悉，逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与，包括阿里-通义大模型、百度文心大模型、MiniMax-aba
2024-11-29 11:42
国产大模型全阵容，中文大模型竞技场推出！

LMSYS Org推出的大模型竞技场Chatbot Arena，已成为海外最具公信力的大模型榜单之一，但该榜单中文化程度相对不足。近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、讯飞星火、
2024-06-01 08:19
百度计算机视觉首席科学家王井东：在视觉的竞技场，研究与落地没有明显的界限

去年年底，2022年 IEEE Fellow（全球电子与电气工程领域最高荣誉）名单发布，有人在知乎上评论：「王井东老师终于当选了，实至名归。」在中国计算机视觉领域，王井东是一个无人不知、无人不晓的研究者。在学术圈，人们会讨论他在 2019 年视觉算法数不胜数之际仍能占据群雄的 HRNet（一个用于视
2023-10-29 08:32
反超DeepSeek！新版GPT-4o登顶竞技场，奥特曼：还会更好

GPT-4o悄悄更新版本，在大模型竞技场超越DeepSeek-R1登上并列第一。除了数学（第6），还在多个单项上拿下第一：创意写作；编程；指令遵循；长文本查询；多轮对话；先直观看下新版GPT-4o的能力如何，还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。
2025-02-18 10:20
GPT-4omini排名雪崩，大模型竞技场规则更新，奥特曼刷分小技巧无效了

大模型竞技场规则更新，GPT-4o mini排名立刻雪崩，跌出前10。新榜单对AI回答的长度和风格等特征做了降权处理，确保分数反映模型真正解决问题的能力。想用漂亮的格式、增加小标题数量等技巧讨好用户、刷榜，现在统统没用了。在新规则下，奥特曼的GPT-4o mini、马斯克的Grok-2系列排名显著下
2024-09-04 09:10
GPT-4王冠没掉！Claude3竞技场人类投票成绩出炉：仅居第三

Claude 3的竞技场排名终于来了：短短3天内，20000张投票，将榜单的流量推向空前。最终，Claude 3最强的“大杯”模型Opus得分1233，成为第一个能和GPT-4-Turbo一较高下的选手。
2024-03-12 16:38
Meta深夜开源Llama4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

万万没想到。Meta 选择在周六日，发布了最新 AI 模型系列 ——Llama 4，这是其 Llama 家族的最新成员。该系列包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
2025-04-07 14:30
用Cursor打造大模型竞技场：最会整活的居然是它

有想法学习简单的python编程时，最固有的思维就是通过课程来具备基础的编程能力。至少我书架上还躺着一本落灰的《Python 编程从入门到实践》，B 站收藏夹里放着的《Python全套课程》视频。可是在Twitter 上，Cloudflare 副总裁发了个视频，展示了自己 8 岁的女儿如何利用 Cu
2024-09-30 08:20
Claude3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

GPT-4真的被反超了！大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。连小杯Haiku也跻身第二梯队，超过了GPT-4-0613这个型号，把GPT-3.5-turbo远远甩在身后。
2024-03-29 15:53
MetaLlama4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车

Meta 翻车来得猝不及防。上周六，Meta 发布了最新 AI 模型系列 ——Llama 4，并一口气出了三个款，分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
2025-04-08 14:22