首页 > 湖南大学

湖南大学

  • 湖南大学信科院刘璇教授团队在多智能体强化学习领域取得重要进展

    强化学习近期,信息科学与工程学院刘璇教授团队在多智能体强化学习领域取得了重要进展,提出了一种利用经验回溯与轨迹筛选提升样本效率的多智能体选择性学习方法。尽管多智能体强化学习已经在游戏、自动驾驶等领域有广泛应用和实践,但稀疏奖励问题仍制约着多智能体强化学习算法在复杂协作任务中的样本效率。在稀疏奖励的多