首页 > 竞技场

竞技场

  • 用Cursor打造大模型竞技场:最会整活的居然是它

    有想法学习简单的python编程时,最固有的思维就是通过课程来具备基础的编程能力。至少我书架上还躺着一本落灰的《Python 编程从入门到实践》,B 站收藏夹里放着的《Python全套课程》视频。可是在Twitter 上,Cloudflare 副总裁发了个视频,展示了自己 8 岁的女儿如何利用 Cu

  • 李开复回应一切:竞技场排名“让我们有信心继续做预训练”

    国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o(5月版本),当零一万物的名字紧跟在OpenAI、Google之后,李开复却如是坦言。就在“大模型六小强”叫停预训练的传闻甚嚣尘上之时,李开复旗下零一万物历时5月憋了个大招,用实际行动回应一切:推出最新旗舰模型Yi-Lightnin

  • 黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10

    龙争虎斗的大模型竞技场,今天突然更新:国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。可以看到,它的成绩几乎与GPT-4-0125-preview持平。同时,国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜,位居第15位。这个结果来

  • 3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

    3D生成也有自个儿的人工评测竞技场了~来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测。3DGen-Arena同样是让两个模型进行比较,分文生3D、图生3D

  • 国产大模型全阵容,中文大模型竞技场推出!

    LMSYS Org推出的大模型竞技场Chatbot Arena,已成为海外最具公信力的大模型榜单之一,但该榜单中文化程度相对不足。近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、

  • 百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限

    去年年底,2022年 IEEE Fellow(全球电子与电气工程领域最高荣誉)名单发布,有人在知乎上评论:「王井东老师终于当选了,实至名归。」在中国计算机视觉领域,王井东是一个无人不知、无人不晓的研究者。在学术圈,人们会讨论他在 2019 年视觉算法数不胜数之际仍能占据群雄的 HRNet(一个用于视

  • GPT-4omini排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了

    大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。新榜单对AI回答的长度和风格等特征做了降权处理,确保分数反映模型真正解决问题的能力。想用漂亮的格式、增加小标题数量等技巧讨好用户、刷榜,现在统统没用了。在新规则下,奥特曼的GPT-4o mini、马斯克的Grok-2系列排名显著下