李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥将修改争议张量名
11月15日消息,AI大模型创业公司“零一万物”正式公开回应了其Yi大模型涉嫌抄袭LLaMA事件,称做法确实不妥,将会按照外界建议修改争议张量(Tensor)名。
零一万物由创新工场董事长兼CEO李开复于今年创办,并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
然而在不久前,开发者ehartford在Yi-34B的Hugging Face开源主页上表示,称该模型使用了Meta LLaMA的架构,只对两个张量名称进行了修改,分别为input_layernorm和post_attention_layernorm。
同时ehartford还表示,其希望该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。
零一万物开源团队总监Richard Lin昨天承认,修改Llama张量名的做法不妥,将会按照外界建议把“修改后的张量名称从Yi改回LLaMA”。
Richard Lin表示,出现这一问题主要是由于开发人员疏忽导致,开发人员为了满足测试要求,在代码中进行了几次重命名,但是后面忘记将张量名称修改回LLaMA了。
不过另一名开发者JosephusCheung则表示,既然官方已经宣布修改Yi大模型张量名称,那么Yi便是LLaMA的衍生作品,因为其推理部分和模型定义都是“LLaMA”的一部分。
目前Richard Lin暂未对此进行回复。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。