注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要: 針對考慮彈性振動、模型不確定干擾下的垂直起降運載器姿態(tài)穩(wěn)定問題,將魯棒觀測器和深度強化學(xué)習(xí)中的近端策略優(yōu)化算法相結(jié)合,研究了一種基于魯棒觀測器的近端策略優(yōu)化(robust observer-based proximal policy optimization, ROB-PPO)方法。該方法設(shè)計魯棒觀測器重構(gòu)受彈性振動干擾的運載器姿態(tài)信息,將魯棒觀測器與運載器動力學(xué)模型組成環(huán)境,將魯棒觀測器得到的重構(gòu)姿態(tài)作為深度強化學(xué)習(xí)算法的狀態(tài),使得深度強化學(xué)習(xí)智能體與之不斷交互,從而訓(xùn)練智能體控制運載器姿態(tài)穩(wěn)定。(剩余18414字)
登錄龍源期刊網(wǎng)
購買文章
基于魯棒觀測器的深度強化學(xué)習(xí)垂直起降運載器姿態(tài)穩(wěn)定研究
文章價格:6.00元
當前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com