特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

隨機線性二次問題中一類改進的強化學習方法

  • 打印
  • 收藏
收藏成功

摘  要:隨機線性二次問題是一類重要且研究較為成熟的隨機控制問題。其中,部分信息條件下的隨機線性二次問題是指系統(tǒng)的狀態(tài)方程或代價函數(shù)中存在未知系數(shù)的情形,該文在前人工作的基礎(chǔ)上,改進部分信息條件下線性二次問題的最優(yōu)控制在線強化學習算法。所研究系統(tǒng)方程和代價函數(shù)的系數(shù)都存在未知量,在此條件下,算法通過可觀察的樣本軌跡和回報函數(shù)求得最優(yōu)控制以及代價函數(shù)中的未知系數(shù),進一步地,我們給出迭代過程收斂性與控制穩(wěn)定性的證明。(剩余4004字)

目錄
monitor