OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 行业动态 > OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

新火种 2024-06-04

除了OpenAI自己，居然还有别人能用上GPT-4-Base版？？

也就是未经微调的预训练版，还不会对话聊天，只会补全句子的模型。

EPFL（瑞士洛桑联邦理工）团队申请到了访问权限，用于研究“上下文学习足以让大模型跟随指令吗？”。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

也就是不用监督微调、也不用RHLF或其他强化学习对齐方法，只靠提示词能走多远？

预训练模型，究竟能不能一步登天，直接改造成聊天机器人或AI助手？

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

如果可行，将大大降低类ChatGPT大模型的开发难度。

免微调对齐靠谱吗？

免微调对齐，让刚出炉的预训练模型不止会“文本补全”，只从提示词中学会和用户对话、跟随指令，一直是业界关注的研究方向。

目前的SOTA方法URIAL来自艾伦研究所，使用系统提示词+少数风格示例就能达到不错的效果。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

但EPFL团队发现，URIAL仍无法完全弥补与指令微调模型的差距，尤其在多轮对话中的表现更差一些。

实验中，在Llama系列、Mistral系列和一般人接触不到的GPT-4-Base都观察到这种现象。

其中GPT-4-Base的API访问权限从OpenAI Researcher Access Program项目中申请到。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

EPFL团队从这里出发，尝试了各种办法来提升上下文学习的效果。

首先他们增加示例的数量，但发现帮助不大，没有随着例子数目增加性能就提升的趋势。这一点跟图像分类、机器翻译等任务还不太一样。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

然后他们使用了贪心搜索算法，从一大堆示例中选择最佳的添加到上下文。

这种方法可以进一步提高性能，但与指令微调模型的差距仍然存在，特别是在 AlpacaEval 2.0基准测试中。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

此外他们还发现，贪心搜索为某个特定模型找到的最佳示例，对于其他模型不能可靠地迁移。

也就是说，不同的示例适合不同的模型。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

团队还进行了一系列消融实验，以更多地了解上下文学习的工作原理。

他们发现，在MT-Bench这样的综合评测中，示例包含正确的“问题-答案对”至关重要。

这与此前大模型在分类任务中，只要有大量示例，部分标签错了也无所谓的发现非常不同。

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

所以最终得出的结论是：

论文最后分析，大语言模型可能通过上下文学习只学会了如何模仿例子里的回答风格，但还没有真正理解执行指令的逻辑。

指令跟随任务相对还是比较复杂和开放的，没那么容易掌握。

想让AI助手更“听话”，暂时还是很难有捷径可走。

Tags:

原始提示

相关推荐

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

2024-06-04

这个AI办公应用火了：简短提示词出PPT，打包GPTs帮你打工干活

2024-02-19

贾扬清创业新动作：推出AIGC提示工具，几个字玩转SDXL，细节拉满

2024-01-11

Spotify测试AI歌单功能输入提示词就能创建歌单

2023-12-23

联想申请大模型提示词专利，可从大模型服务端获取对目标提示词的目标响应信息

2023-12-09

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

封杀AI“照骗”，“淘宝们”终于不忍了？

钛媒体AGI独家｜小米华为争夺AI大模型研发人才，年薪最高120万元，AI工程师岗位增长近70%

2025-04-09 11:45

百度与宁德时代签署战略合作协议围绕无人驾驶领域

2025-04-05 11:30

AI开启新赛道，OpenAI发布GPT-4.5，主攻“自然对话”

2025-04-08 11:27

Meta计划在第二季度推出独立的AI应用MetaAI

2025-04-06 11:28

云市场“卷”疯了！腾讯云亮剑AI生死局！

2025-04-08 09:51

Meta发布开源大模型Llama4：首次采用“混合专家”架构

2025-04-07 18:21

GPT-4.5发布！OpenAI最大最贵模型，主打情商高，奥特曼带娃缺席发布会

2025-04-06 11:28

余承东卸任车BU，或是华为造车模式跑通了

2025-04-08 09:53

OpenAI“史上最贵”大模型发布，定价是DeepSeek的280倍

2025-04-06 11:29