注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
摘 要:隨機線性二次問題是一類重要且研究較為成熟的隨機控制問題。其中,部分信息條件下的隨機線性二次問題是指系統(tǒng)的狀態(tài)方程或代價函數(shù)中存在未知系數(shù)的情形,該文在前人工作的基礎(chǔ)上,改進部分信息條件下線性二次問題的最優(yōu)控制在線強化學習算法。所研究系統(tǒng)方程和代價函數(shù)的系數(shù)都存在未知量,在此條件下,算法通過可觀察的樣本軌跡和回報函數(shù)求得最優(yōu)控制以及代價函數(shù)中的未知系數(shù),進一步地,我們給出迭代過程收斂性與控制穩(wěn)定性的證明。(剩余4004字)
登錄龍源期刊網(wǎng)
購買文章
隨機線性二次問題中一類改進的強化學習方法
文章價格:4.00元
當前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com