OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 行业动态 > OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

新火种 2024-12-07

OpenAI“双12”直播第二天，依旧简短精悍，主题：

新功能强化微调（Reinforcement Fine-Tuning），使用极少训练数据即在特定领域轻松地创建专家模型。

少到什么程度呢？最低几十个例子就可以。

CEO奥特曼表示“效果一级棒，是我2024年最大的惊喜，期待看到人们构建什么！”

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

那么效果有多棒呢？

微调后的o1-mini模型得分提高80%，直接反超o1正式版。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

目前OpenAI已开启强化微调研究计划，开发者可以申请强化微调API的alpha版本访问权限。

进行测试时，可使用几十到几千个高质量数据，模型能够通过强化学习自行探索和学习如何推理复杂任务。

蹲守直播间的网友们听得也是one愣one愣的，完全没有料想到今晚“圣诞盲盒“是酱婶儿的。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI员工Jerry Tworek则表示“AGI不是授人以鱼，而是授人以渔”。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI微调首次支持强化学习

直播嘉宾除了Mark Chen、John Allard、Julie Wang三位OpenAI自家研究员，还有伯克利实验室计算生物学家Justin Reese，他们共同演示了强化微调功能的全过程。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

具体来说，这是一个生物医学任务，AI需要根据病例描述的症状，找出相关基因。

训练数据长这样：

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

评分模型（Grader）会对模型的答案进行评分，OpenAI会提供不同的评分模型，并支持自定义。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

强化微调步骤很简单，在网页界面可选择训练集和验证集。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

再根据情况配置超参数即可。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

微调过程中，可以观察模型性能指标的变化趋势。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

测试完成后，也可以查看模型对每条验证数据的输出，这里TSC2基因是正确答案，模型把它排在第一位，所以通过。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

目前OpenAI内部测试中，强化微调在生物化学、安全、法律和医疗保健领域取得成功。

强化微调将在2025年初作为产品发布，对企业、大学和研究院已开放申请测试通道。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

看完这场直播后，有人总结：强化微调可能并不适合所有任务，但会在科学领域带来突破性的成果。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

奥特曼默认会发Sora

OpenAI直播第二天，对比第一天o1正式发布、立等可用，似乎平淡了一些。

有不满足的网友表示：where is GPT-4.5？

评论区猜测可能大货会放在最后一天。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

不过，有网友钓鱼钓出了奥特曼，且奥特曼没有否认会发布Sora的消息。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

参考链接：

Tags:

惊喜数据

相关推荐

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

2024-12-07

Baklib如何在AI浪潮中捍卫公司数据安全

2024-12-05

广州：鼓励电商企业积极运用5G、云计算、物联网、大数据、区块链等创新技术

2024-12-05

增强AI时代数据安全

2024-12-03

创新引领可信数据空间建设

2024-12-01

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

华为离职“天才少年”，发布首个通用具身基座大模型

Manus神话破碎？邀请码炒至数万元，转头被MetaGPT成员3小时复刻

2025-04-23 11:27

OpenAI发布新研究：用CoT监控大模型防止恶意行为

2025-04-27 11:18

智元机器人发布大模型，创始人曾系华为“天才少年计划”人员实探公司：频繁有人拜访

2025-04-26 11:21

华为离职“天才少年”官宣刷屏！头部国产机器人好事将近

2025-04-26 11:18

1元起京东举办全国首场人形机器人拍卖：含马拉松第2名小孩哥

2025-04-21 18:21

3月6日蓝色光标涨停分析：小红书概念股，智谱AI，SoraAI视频概念热股

2025-04-23 11:28

人形机器人+小米汽车双轮驱动威孚高科强势涨停

2025-04-24 11:28

3月6日新开普涨停分析：国产软件，华为云·鲲鹏，人工智能概念热股

2025-04-23 11:32

历史新高，“300953”！小米机器人概念火了

2025-04-23 11:32