北京大学取得分布式多智能体合作方法专利，通过强化学习进行训练

首页 > AI资讯 > 最新资讯 > 北京大学取得分布式多智能体合作方法专利，通过强化学习进行训练

北京大学取得分布式多智能体合作方法专利，通过强化学习进行训练

新火种 2023-12-21

金融界2023年12月18日消息，据国家知识产权局公告，北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“，授权公告号CN116578636B，申请日期为2023年5月。

专利摘要显示，本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括：对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器；所述历史寄存器随着智能体与环境交互的进行，所述历史寄存器持续接受新的历史状态，并将超过容量限制的早期的历史状态丢弃；构造历史背景网络，其中，所述历史背景网络的输入为当前观测状态，与历史寄存器中的历史状态，通过数据挖掘与融合，所述历史背景网络的输出历史背景嵌入状态；构造隐式变分推理网络，构造策略网络和状态价值网络并通过强化学习进行训练，其中，所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态，所述策略网络和所述状态价值网络的输出为策略分布和状态价值。

本文源自：金融界

作者：情报员

Tags:

GAN 北京大学分布式

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

北京大学取得分布式多智能体合作方法专利，通过强化学习进行训练

浪潮信息发布自动驾驶分布式计算框架AutoDRRT2.0

PPTV创始人姚欣AI再创业，“分布式推理”终于有人做了

首个超大规模GAN模型！生成速度比Diffusion快20+倍，0.13秒出图

微创机器人-B(02252)上涨5.24%，报20.9元/股

石头科技申请清洁机器人专利，位置确定装置的至少部分凸出主体设置

热门文章

我国首个林草行业大模型研发成功

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

蒙曼谈人工智能冲击：守住人类对于生活的感受

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

浩物股份：公司暂未本地部署接入DeepSeek大模型

大消费高低切换加速涨价概念正逐步化身市场暗线

两会新华解码丨“强化宏观政策民生导向”透出什么深意？