大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

首页 > AI资讯 > 最新资讯 > 大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

新火种 2023-12-20

大语言模型（LLM）被越来越多应用于各种领域。然而，它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则：每个词（token）的生成都需要进行一次前向传播，需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。近日，滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布 EAGLE，旨在提升大语言模型的推理速度，同时保证模型输出文本的分布一致。这种方法外推 LLM 的第二顶层特征向量，能够显著提升生成效率。

具有以下特点：比普通自回归解码（13B）快 3 倍；比 Lookahead 解码（13B）快 2 倍；比 Medusa 解码（13B）快 1.6 倍；可以证明在生成文本的分布上与普通解码保持一致；可以在 RTX 3090 上进行训练（1-2 天内）和测试；可以与 vLLM、DeepSpeed、Mamba、FlashAttention、量化和硬件优化等其他平行技术结合使用。

Tags:

深度学习北京大学模型

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

大模型推理效率无损提升3倍，滑铁卢大学、北京大学等机构发布EAGLE

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

腾讯元器推出智能体新应用，支持公众号主打造专属大模型数字分身

大模型赋能智能座舱！NVIDIA深度适配通义千问大模型

热门文章

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

AI图像生成平台「LiblibAI」获数亿元融资

AI剧本风控项目启动天使轮融资

【VIP机会日报】机器人概念再度走强栏目追踪行业动态提及产业相关公司强势涨停

紫光国微：在特种集成电路业务方面强化业务能力、提升发展质量

联芸科技：我司已量产的商用产品暂未应用于无人驾驶

L3上路倒计时？工信部加快推进智能网联车规划产业基建+商业化迎来关键节点

资讯出海，扬帆起航正当时！

ChatGPT引爆“吉卜力”风格图像生成浪潮同时激发AI违法争议