Meta提出全新注意力机制S2A大模型准确率提升至80.3%

首页 > AI资讯 > 行业动态 > Meta提出全新注意力机制S2A大模型准确率提升至80.3%

Meta提出全新注意力机制S2A大模型准确率提升至80.3%

新火种 2023-12-06

要点:

1. Meta提出的注意力机制S2A能有效提升LLM回答问题的事实性和客观性，降低模型对无关信息的敏感度，使其更准确。

2. S2A通过深思熟虑的注意力机制（System2Attention）解决了LLM在回答问题时容易受上下文中虚假相关性影响的问题，提高了模型的推理能力。

3. S2A的实现方式利用LLM本身构建，通过指令调整的LLM删除不相关文本，重写上下文，以更好地控制注意力焦点，进而提升回答的准确性。

站长之家11月28日消息:在2023科技领域，大语言模型（LLM）的应用日益广泛，但其在回答问题时存在的问题引起了关注。Meta团队提出的新注意力机制S2A通过解决LLM容易受到上下文虚假相关性的问题，显著提升了模型的准确性和客观性。这一机制的提出得到了深度学习领域的重要人物LeCun的认可，他表示这将有助于使LLM更具推理能力。

传统LLM存在的问题包括对无关信息的过度敏感和容易受到用户观点的影响。S2A通过更深思熟虑的注意力机制，即System2Attention，有效解决了这些问题。以一个数学计算的例子为证，S2A可以过滤掉无关信息，使模型更关注问题的实质，从而提高答案的准确性。

S2A的实现方式是利用LLM本身构建，通过指令调整的LLM来删除不相关的文本，重新生成上下文。这不仅使模型能够在输出响应之前深思熟虑地推理，还能够控制注意力焦点，类似于人类的方式。实验证明，S2A显著提高了模型的性能，使其更适应复杂的推理任务。

随着理解的加深，添加的文本是无关紧要的，应该被忽略。通过引入更深思熟虑的注意力机制，S2A为解决LLM的问题提供了一种可行的方法，为大型语言模型的进一步发展铺平了道路。

Tags:

机器学习准确率注意力

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

Meta提出全新注意力机制S2A大模型准确率提升至80.3%

脑机接口大战打响：瑞士芯片MiniBMI91%准确率，秒杀马斯克Neuralink

全球首个月球专业大模型发布：撞击坑识别准确率超80%

全华人团队推出多模态大模型新基准，GPT-4o准确率仅为65.5%

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

AIGC年度激辩：3轮交互内准确率95%以上才能真正应用|中国AIGC产业峰会

热门文章

腾讯混元训练营开营，共创50多个大模型应用场景

性能不等于销量NVIDIA最新AI芯片市场遇冷！客户偏爱成熟老产品

朱啸虎看不上的赛道，腾讯投了150亿独角兽

iOS18.4上线中文版苹果AI：但请不要期待Apple智能

语音界Deepseek！百度最新跨模态端到端语音交互，成本最高降90%

腾讯构建AI新矩阵：四大产品线合龙

小米真AI智能眼镜下月发布：双芯架构、自带镜头

DeepSeekV3模型重磅升级！腾讯/微美全息加速AI大模型“上车”多场景落地

微软被曝关闭上海人工智能实验室：Logo被移除办公设备清空