斯坦福大学研究:强化学习智能体能间接学习语言技能
站长之家8月4日 消息:斯坦福大学的研究团队在自然语言处理领域取得了突破性进展,探究了强化学习(RL)智能体是否能在没有明确语言监督的情况下间接学习语言技能。研究的主要焦点是探索强化学习智能体是否能够像通过与环境互动以实现非语言目标的方式学习语言技能。为了实现这一点,研究团队设计了一个办公室导航环境
站长之家8月4日 消息:斯坦福大学的研究团队在自然语言处理领域取得了突破性进展,探究了强化学习(RL)智能体是否能在没有明确语言监督的情况下间接学习语言技能。研究的主要焦点是探索强化学习智能体是否能够像通过与环境互动以实现非语言目标的方式学习语言技能。为了实现这一点,研究团队设计了一个办公室导航环境
“平地起惊雷,至今有余音。”去年的11月,OpenAI发布ChatGPT给科技圈劈下了一道惊雷,引爆了全世界的AI大模型热潮,全球科技巨头公司争先恐后地推出通用大模型,探索产业应用的可能。短短一年后,北京时间11月7日凌晨2点,OpenAI在美国旧金山举行了其首届开发者大会。