这才是真・开源模型!公开「后训练」一切,性能超越Llama3.1Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。
当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发
刚刚,国产大模型明星选手孟子GPT上新!400亿参数通用大模型正式发布,已开启邀测。数据显示,孟子GPT-40B版本全面领先7B版本,大约提升10-15个百分点。并超越部分国内大模型,在多语言任务等方面接近ChatGPT-3.5。
20日讯,SK海力士副社长柳成洙(Ryu Seong-su)宣布,公司目标开发一款性能比当前HBM高出20至30倍的产品。他表示,公司致力于通过面向人工智能的内存解决方案来应对大众市场。随着人工智能技术的快速进步,对高性能内存的需求将持续增长。 (BusinessKorea)
研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单上超越了其他同级模型。OpenAI在九月份为ChatGPT添加了图像输入功能,允许用户使用上传一张或多张图像配合进行对话,
2023年12月29日消息,据国家知识产权局公告,华为技术有限公司申请一项名为“基于神经网络的图像处理中的辅助信息的独立定位“,公开号CN117321989A,申请日期为2021年4月。专利摘要显示,本申请提供了用于使用具有两个或两个以上层的神经网络处理图像数据或图像特征数据的方法和装置。
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发
一加携手高通线上举办一加13性能解读特别活动,一加 13 是首批搭载最新骁龙 8 至尊版移动平台的旗舰机型,提供同档唯一 24GB+1TB 超级内存及第二代天工散热系统 Pro,并带来多项独家性能黑科
埃隆·马斯克表示,芯片供应短缺在人工智能竞赛中有所缓解;xAI希望在五月份完成对聊天机器人Grok下一版本的培训;特斯拉大模型Grok 2.0版本的性能将“好于”ChatGPT-4;如果我们将通用人工智能定义为比最聪明的人更聪明,这可能在明年,比如在两年内实现。