特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于高斯混合模型的分布式強(qiáng)化學(xué)習(xí)算法魯棒性?xún)?yōu)化

  • 打印
  • 收藏
收藏成功

摘 要:當(dāng)前,分布式強(qiáng)化學(xué)習(xí)假設(shè)所有智能體均能正常工作,但在實(shí)際情況中可能存在異常智能體。為此,提出了一種基于高斯混合模型的聚類(lèi)方法,用于優(yōu)化分布式強(qiáng)化學(xué)習(xí)算法。首先,計(jì)算智能體上傳梯度對(duì)應(yīng)的高斯分布概率。其次,根據(jù)高斯分布更新聚類(lèi)模型參數(shù),并重復(fù)執(zhí)行上述步驟直至收斂。最后,根據(jù)聚類(lèi)模型篩選異常梯度。(剩余6969字)

試讀結(jié)束

monitor