OpenAI推出强化微调CEO称是今年最大惊喜之一

首页 > AI资讯 > 最新资讯 > OpenAI推出强化微调CEO称是今年最大惊喜之一

OpenAI推出强化微调CEO称是今年最大惊喜之一

第一财经 2024-12-10

　　当地时间12月6日，OpenAI公布第二日活动主题：推出了强化微调（Reinforcement Fine-Tuning），帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。OpenAI CEO Sam Altman在X发帖称，强化微调的效果非常棒，是他今年最大的惊喜之一，期待看到大家利用这种功能的创造。

　　该项目通过全新的模型定制技术，让开发者可以使用高质量任务集对模型进行微调，并利用参考答案评估模型的响应，从而提升模型在特定领域任务中的推理能力和准确性。

　　OpenAI的研究员称，强化微调并不是只教模型模型输出，它的运作方式是，当模型发现一个问题的时候，研究者给模型空间区仔细思考这个问题，然后评估模型给出的最终解答，运用强化学习，研究者可以强化产生正确答案的思路，抑制产生错误答案的思路，只需要“几十个例子”甚至12个例子，模型就能以有效的新方式学习特定领域的推理。

　　OpenAI研究员演示，强化微调后的o1 mini测试通过率甚至比正式版o1高24%，比未强化微调的o1 mini提高了82%。

（文章来源：第一财经）

Tags:

深度学习惊喜

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

OpenAI推出强化微调CEO称是今年最大惊喜之一

“科八条”以来上交所首家未盈利企业再融资获审核通过帝奥微初步确定询价转让价格为17.73元/股

商汤再次配股筹资28亿港元！多家国际基金、长线基金及现有股东参与

提出发展人工智能三大建议

全球AI顶会NeurIPS2024温哥华开幕中国校企上百篇论文被收录

小雨智造：小米系首家工业具身大模型公司崛起，国家队助力产业化落地

热门文章

AIGC“重塑”影视制作产业快手可灵AI用户超600万探索多元变现模式

北京：预计全市2024年人工智能产业规模突破3000亿元

3连板大业股份：人形机器人业务目前尚处于探索和市场调查阶段

“具身智能”加速人形机器人“进化”

【每日收评】短线情绪回暖！抖音豆包、脑机接口概念股批量涨停，两市成交额却跌破1.4万亿

交通银行举办上海金融科技国际论坛“数智驱动、开放共赢：金融科技赋能金融高质量发展”平行论坛

推动AI赋能新型工业化江苏这批案例如何解决痛点

连收6个涨停板，因机器人板块概念走强？山东矿机：公司未涉及人形机器人

盘点教育行业“老兵”再创业，方向大多汇聚“AI+教育”赛道