贾佳亚团队联手剑桥清华等共推评测新范式一秒侦破大模型“高分低能”
贾佳亚团队全新评测基准MR-Ben发布,拒绝大模型“高分低能”随着人工智能领域经历GPT时刻,学术界和产业界共同发力,每月甚至每周都有新的模型问世,大模型产品之多可以说是让人眼花缭乱。为了筛选出真正业界领先的大模型产品,业内衍生出了错综复杂的各类大模型评测方式,大家都希望为大模型做出客观公正的评测,
贾佳亚团队全新评测基准MR-Ben发布,拒绝大模型“高分低能”随着人工智能领域经历GPT时刻,学术界和产业界共同发力,每月甚至每周都有新的模型问世,大模型产品之多可以说是让人眼花缭乱。为了筛选出真正业界领先的大模型产品,业内衍生出了错综复杂的各类大模型评测方式,大家都希望为大模型做出客观公正的评测,