首页 > AI资讯 > 最新资讯 > 北京大学取得分布式多智能体合作方法专利,通过强化学习进行训练

北京大学取得分布式多智能体合作方法专利,通过强化学习进行训练

新火种    2023-12-21

金融界2023年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2023年5月。

专利摘要显示,本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。

本文源自:金融界

作者:情报员

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。