首页 > AI资讯 > 最新资讯 > 大模型晚报|李开复旗下ai公司发布首款大模型,在魔搭社区开源-品玩

大模型晚报|李开复旗下ai公司发布首款大模型,在魔搭社区开源-品玩

新火种    2023-11-11

大模型资讯:

李开复旗下AI公司发布Yi-34B大模型,在魔搭社区开源

李开复带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

在 Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72 分位列全球第一,碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

马斯克旗下公司xAI 公布全新大模型产品 Grok-1,正处于早期测试阶段

马斯克旗下 AI 公司xAI 近日宣布,旗下大模型产品Grok-1 现已进入早期测试阶段。

据悉,Grok-1 是一款基于Transformer 的自回归模型,可以和用户进行对话。据 xAI 表示,Grok-1 通过 X 平台进行训练,可以实时了解最新情况并回答用户的相关问题。

据悉,Grok-1 在 HumanEval 上表现优于GPT3.5和LlaMa等大模型产品。

中科院发布AI模型MatChat,预测无机材料合成路径

据中科院物理所官方消息,近期,中国科学院物理研究所/北京凝聚态物理国家研究中心SF10组和中国科学院计算机网络信息中心共同合作,将AI大模型应用于材料科学领域,将数万个化学合成路径数据投喂给大语言模型LLAMA2-7b,从而获得了MatChat模型。

该模型可根据所询问的结构进行逻辑推理,并输出相应的制备工艺和配方。目前已部署上线(http://chat.aicnic.cn/onchat),并向所有材料科研人员开放使用,为材料研究和创新带来了新启发和新思路。

该工作为大语言模型在细分科学领域的应用,提出了一种有可能的解决思路,并初步展示出了方法的可行性。通过自然语言模型提取文献数据,进而将文献数据用于语言模型训练是发展细分科学领域的一条可行路径。

谷歌发布 MetNet-3,高精度预测天气

据谷歌官方消息,旗下天气预测模型MetNet-3现已亮相,可以提前24小时对天气情况进行高解析度预测。

谷歌表示,MetNet-3可提供降水、地表温度、风速、风向等多个指标,其空间解析度可达 1 至 4 公里,并以 2 分钟为分析区间。

谷歌表示,已将 MetNet-3 的功能整合到与天气相关的各种谷歌产品和技术中。

图灵奖得主警告:不能让大型科技公司制定 AI 规则

据 Business Insider 报道 ,图灵奖获得者Yoshua Bengio 今日表示,AI 领域被少数巨头企业控制将可能给人类社会带来极大的风险。

据 Bengio 在接受采访时表示,AI 技术的发展正在帮助人类建立越来越强大的系统,但是谁来控制这些系统将会是一个核心问题。

Bengio 认为,相关组织在制定 AI 技术发展规则时,不能只听取科技公司的意见,应将确保公众的安全和道德考虑居中心位置。

昆仑万维“天工”大模型通过备案,即日起面向全社会开放服务

昆仑万维官方宣布,昆仑万维天工大模型现已通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务,用户可通过官方 App、官网直接注册使用。

“天工”大模型号称国内首个对标 ChatGPT 的双千亿级语言大模型,也是 AI 搜索引擎、对话助手,拥有强大的自然语言处理和智能交互能力,能够实现个性化 AI 搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。

该大模型于今年 4 月 17 日正式发布,同时启动邀测,官方表示其 AI 生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理运算等多元化需求。

重点论文:

微软联手北大,发布PPTC 测试基准

据HuggingFace 页面报道,微软研究院联手北京大学,共同发布了一款名为 PPTC 的大模型测试基准,可以用于测试大模型在PPT 生成方面的能力。

研究团队表示,PPTC包含 279 个涵盖不同主题的多回合会话和数百条涉及多模式操作的说明。研究团队还提出了PPTX-Match评估系统,该系统根据预测文件而不是标签API序列来评估大语言模型是否完成指令,因此它支持各种LLM生成的API序列。

研究团队表示,当前大语言模型在生成PPT 内容方面主要存在三个方面的不足,包括多轮会话中的错误累积、长PPT模板处理和多模态感知问题。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。