首页 > 竞技场

竞技场

  • 逆水寒推出“AI竞技场”:邀1亿玩家参与AI模型评估

    【CNMO科技消息】近日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与,包括阿里-通义大模型、百度文心大模型、MiniMax-aba

  • 国产大模型全阵容,中文大模型竞技场推出!

    LMSYS Org推出的大模型竞技场Chatbot Arena,已成为海外最具公信力的大模型榜单之一,但该榜单中文化程度相对不足。近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、

  • 百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限

    去年年底,2022年 IEEE Fellow(全球电子与电气工程领域最高荣誉)名单发布,有人在知乎上评论:「王井东老师终于当选了,实至名归。」在中国计算机视觉领域,王井东是一个无人不知、无人不晓的研究者。在学术圈,人们会讨论他在 2019 年视觉算法数不胜数之际仍能占据群雄的 HRNet(一个用于视

  • 反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

    GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。除了数学(第6),还在多个单项上拿下第一:创意写作;编程;指令遵循;长文本查询;多轮对话;先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。

  • GPT-4omini排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了

    大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。新榜单对AI回答的长度和风格等特征做了降权处理,确保分数反映模型真正解决问题的能力。想用漂亮的格式、增加小标题数量等技巧讨好用户、刷榜,现在统统没用了。在新规则下,奥特曼的GPT-4o mini、马斯克的Grok-2系列排名显著下

  • 用Cursor打造大模型竞技场:最会整活的居然是它

    有想法学习简单的python编程时,最固有的思维就是通过课程来具备基础的编程能力。至少我书架上还躺着一本落灰的《Python 编程从入门到实践》,B 站收藏夹里放着的《Python全套课程》视频。可是在Twitter 上,Cloudflare 副总裁发了个视频,展示了自己 8 岁的女儿如何利用 Cu