特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

融合先驗知識的異構(gòu)多智能體強化學習算法研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:近年來,基于深度強化學習的機器學習技術(shù)突破性進展為智能博弈對抗提供了新的技術(shù)發(fā)展方向。針對智能對抗中異構(gòu)多智能體強化學習算法訓(xùn)練收斂速度慢,訓(xùn)練效果差異大等問題,提出了一種先驗知識驅(qū)動的多智能體強化學習博弈對抗算法PK-MADDPG,構(gòu)建了雙重Critic框架下的MADDPG模型。該模型使用了經(jīng)驗優(yōu)先回放技術(shù)來優(yōu)化先驗知識提取,在博弈對抗訓(xùn)練中取得顯著的效果。(剩余15496字)

monitor