首页 > 竞技场

竞技场

  • 李开复回应一切:竞技场排名“让我们有信心继续做预训练”

    国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o(5月版本),当零一万物的名字紧跟在OpenAI、Google之后,李开复却如是坦言。就在“大模型六小强”叫停预训练的传闻甚嚣尘上之时,李开复旗下零一万物历时5月憋了个大招,用实际行动回应一切:推出最新旗舰模型Yi-Lightnin

  • 黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10

    龙争虎斗的大模型竞技场,今天突然更新:国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。可以看到,它的成绩几乎与GPT-4-0125-preview持平。同时,国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜,位居第15位。这个结果来

  • OpenAI重夺竞技场第一,但这波靠的是4o

    OpenAI开发者日新加坡站今天启幕,果不其然,ChatGPT又出手了:Gemini刚在竞技场头把交椅上坐了不到一周,最新版ChatGPT轻轻一更新,第一再次易主。对,还不是o1满血版,而是新版4o。具体来说,此番GPT-4o更新的是“创意写作能力”,官方说法是:o1核心贡献者Karina Nguy

  • 3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

    3D生成也有自个儿的人工评测竞技场了~来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测。3DGen-Arena同样是让两个模型进行比较,分文生3D、图生3D

  • 逆水寒推出“AI竞技场”:邀1亿玩家参与AI模型评估

    【CNMO科技消息】近日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与,包括阿里-通义大模型、百度文心大模型、MiniMax-aba

  • 国产大模型全阵容,中文大模型竞技场推出!

    LMSYS Org推出的大模型竞技场Chatbot Arena,已成为海外最具公信力的大模型榜单之一,但该榜单中文化程度相对不足。近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、

  • 百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限

    去年年底,2022年 IEEE Fellow(全球电子与电气工程领域最高荣誉)名单发布,有人在知乎上评论:「王井东老师终于当选了,实至名归。」在中国计算机视觉领域,王井东是一个无人不知、无人不晓的研究者。在学术圈,人们会讨论他在 2019 年视觉算法数不胜数之际仍能占据群雄的 HRNet(一个用于视

  • GPT-4omini排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了

    大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。新榜单对AI回答的长度和风格等特征做了降权处理,确保分数反映模型真正解决问题的能力。想用漂亮的格式、增加小标题数量等技巧讨好用户、刷榜,现在统统没用了。在新规则下,奥特曼的GPT-4o mini、马斯克的Grok-2系列排名显著下