正则 - 新火种

首页 > 正则

Bengio团队新论文，KL正则化有漏洞，强化学习新策略：不要做我可能不会做的事情

在强化学习中，当智能体的奖励机制与设计者的意图不一致时，可能会导致不理想的行为，而KL正则化作为一种常用的解决方案，通过限制智能体的行为来防止这种情况，但智能体在某些情况下仍可能表现出意料之外的行为；为了提高智能体的可靠性，研究人员提出了新的理论方案，通过改变指导原则来增强智能体在未知情况下的谨慎性
2024-11-21 11:32
ICCV2021|用于无监督图像生成解耦的正交雅可比正则化

作者| 魏于翔编辑 | 王晔本文是对发表于计算机视觉和模式识别领域的顶级会议 ICCV 2021的论文“Orthogonal Jacobian Regularization for Unsupervised Disentanglement in Image Generation（用于无监督图像生成解
2023-11-01 08:21