零一万物回应大模型争议：尊重开源社区的反馈，将更新代码

首页 > AI资讯 > 最新资讯 > 零一万物回应大模型争议：尊重开源社区的反馈，将更新代码

零一万物回应大模型争议：尊重开源社区的反馈，将更新代码

新火种 2023-11-19

21世纪经济报道记者白杨北京报道

11月14日，针对开源社区Hugging Face提出的“除了两个张量被重命名外，大模型Yi完全使用了 Llama 的架构”一事，零一万物向21世纪经济报道记者回应称，“在大量训练实验过程中，由于实验执行的需要对代码做了更名，我们尊重开源社区的反馈，将代码进行更新，也更好的融入Transformer生态。”

11月初，由创新工场董事长兼CEO李开复创办的AI公司“零一万物”正式发布了开源大模型“Yi”。当时，对于为何选择做开源大模型，李开复表示，“零一万物的发展受益于此前开源社区的一些集体智慧，这也让我们有义务去做一些贡献”。

在回应中，零一万物也表示，GPT是一个业内公认的成熟架构，Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构，借鉴了行业顶尖水平的公开成果，由于大模型技术发展还在非常初期，与行业主流保持一致的结构，更有利于整体的适配与未来的迭代。同时基于零一万物团队对模型和训练的理解做了大量工作，也在持续探索模型结构层面本质上的突破。

其同时强调，模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力，比如数据工程、训练方法、baby sitting（训练过程监测）的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI infra 能力等，投入了大量研发和打底工作，这些工作往往比起基本结构能起到更大的作用跟价值，这些也是零一万物在大模型预训练阶段的核心技术护城河。

据记者了解，Yi团队开源总监也在Hugging Face社区中表达了歉意，称“这个命名问题是工作疏忽。在大量的训练实验中，团队对代码进行了重命名以满足实验要求，但是在发布版本之前没有将它们切换回来。对此很抱歉。”

Tags:

大模型社区万物

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

零一万物回应大模型争议：尊重开源社区的反馈，将更新代码

零一万物亮相云栖大会，以模型能力推动AI2.0时代ToB商业模式创新

AI、社区、带货YouTube平台要变天了

核心成员黄文灏加盟字节跳动，零一万物回应：已有高阶负责人到岗

OpenAI断供中国大陆市场，零一万物YiAPI二折平替GPT-4o

大模型公司纷纷被收编！创始人们逐渐变成了“最讨厌的自己”？

热门文章

AI为药物研发按下“快进键”

昔日IPO“美颜”过度纳睿雷达今欲靠跨界并购“补妆”？

中国半导体行业协会：美对华出口限制造成了美国芯片的不安全性和不可靠性

追觅、科沃斯纷纷下场泳池机器人一周内获两笔融资

Adobe发布新生成式AI工具：一次可处理1万张图片！

千亿消费电子龙头涨近20厘米蓝思科技今日表现有两大看点

宇树人形机器人再升级！跑起来更有“人味”轻松驾驭各种地形

周鸿祎风马牛演讲谈AI：2025年是智能体之年分三大步骤六大方向

病毒接下来会做什么？AI正在帮助科学家预测它们的演变