阿里云发布全球最强Qwen2开源模型!超越文心4.0等闭源大模型
6月7日消息,今天阿里云在其技术博客上宣布,正式发布了全球性能最强的开源模型Qwen2-72B。
这一最新模型在性能上超越了美国最强的开源模型Llama3-70B,同时也领先于包括文心4.0、豆包pro、混元pro在内的众多中国闭源大模型。
目前,所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。
此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型
Qwen2系列模型在代码、数学、推理、指令遵循、多语言理解等能力上实现了大幅提升。
在MMLU、GPQA、HumanEval等国际权威测评中,Qwen2-72B一举斩获多项世界冠军,展现了其卓越的性能。
Qwen2-72B在十多个权威测评中获得冠军,超过美国的Llama3-70B模型
此外,Qwen2系列包含5个尺寸的预训练和指令微调模型,均使用了GQA(分组查询注意力)机制,为用户带来了推理加速和显存占用降低的优势。
阿里云CTO周靖人表示,坚持开源开放是阿里云的重要策略,旨在打造AI时代最开放的云,让算力更普惠、让AI更普及。
Qwen2的发布,不仅为全球开发者提供了强大的工具,也为推动AI技术的普及和发展做出了贡献。
目前Qwen2系列模型的API已登陆阿里云百炼平台,并获得了全球众多开源平台和工具的第一时间支持。
此外,Qwen系列模型的总下载量在一个月内翻了一倍,突破1600万次,显示出其在全球开源社区中的广泛影响力。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。
热门文章
![](https://www.xhz.cn/uploads/images/63.jpg)