OpenAI推出强化微调，CEO称是今年最大惊喜之一

首页 > AI资讯 > 行业动态 > OpenAI推出强化微调，CEO称是今年最大惊喜之一

OpenAI推出强化微调，CEO称是今年最大惊喜之一

新火种 2024-12-10

当地时间12月6日，OpenAI公布第二日活动主题：推出了强化微调（Reinforcement Fine-Tuning），帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。OpenAI CEO Sam Altman在X发帖称，强化微调的效果非常棒，是他今年最大的惊喜之一，期待看到大家利用这种功能的创造。该项目通过全新的模型定制技术，让开发者可以使用高质量任务集对模型进行微调，并利用参考答案评估模型的响应，从而提升模型在特定领域任务中的推理能力和准确性。OpenAI的研究员称，强化微调并不是只教模型模型输出，它的运作方式是，当模型发现一个问题的时候，研究者给模型空间区仔细思考这个问题，然后评估模型给出的最终解答，运用强化学习，研究者可以强化产生正确答案的思路，抑制产生错误答案的思路，只需要“几十个例子”甚至12个例子，模型就能以有效的新方式学习特定领域的推理。OpenAI研究员演示，强化微调后的o1 mini测试通过率甚至比正式版o1高24%，比未强化微调的o1 mini提高了82%。

(本文来自第一财经)

Tags:

机器人惊喜

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

OpenAI推出强化微调，CEO称是今年最大惊喜之一

汽车早报【12月7日】

美国医保巨头两天市值蒸发4000亿OpenAI发布强化微调|环球市场

马斯克xAI完成新一轮融资估值据称已超400亿美元

阿联酋主权机构穆巴达拉：未来将加大对亚洲的投资

耗资156亿元2400亿煤业龙头拟收购陕煤电力集团88.65%股权|盘后公告集锦

热门文章

Manus神话破碎？邀请码炒至数万元，转头被MetaGPT成员3小时复刻

OpenAI发布新研究：用CoT监控大模型防止恶意行为

智元机器人发布大模型，创始人曾系华为“天才少年计划”人员实探公司：频繁有人拜访

华为离职“天才少年”官宣刷屏！头部国产机器人好事将近

1元起京东举办全国首场人形机器人拍卖：含马拉松第2名小孩哥

3月6日蓝色光标涨停分析：小红书概念股，智谱AI，SoraAI视频概念热股

人形机器人+小米汽车双轮驱动威孚高科强势涨停

3月6日新开普涨停分析：国产软件，华为云·鲲鹏，人工智能概念热股

历史新高，“300953”！小米机器人概念火了