特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于魯棒觀測器的深度強化學(xué)習(xí)垂直起降運載器姿態(tài)穩(wěn)定研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要: 針對考慮彈性振動、模型不確定干擾下的垂直起降運載器姿態(tài)穩(wěn)定問題,將魯棒觀測器和深度強化學(xué)習(xí)中的近端策略優(yōu)化算法相結(jié)合,研究了一種基于魯棒觀測器的近端策略優(yōu)化(robust observer-based proximal policy optimization, ROB-PPO)方法。該方法設(shè)計魯棒觀測器重構(gòu)受彈性振動干擾的運載器姿態(tài)信息,將魯棒觀測器與運載器動力學(xué)模型組成環(huán)境,將魯棒觀測器得到的重構(gòu)姿態(tài)作為深度強化學(xué)習(xí)算法的狀態(tài),使得深度強化學(xué)習(xí)智能體與之不斷交互,從而訓(xùn)練智能體控制運載器姿態(tài)穩(wěn)定。(剩余18414字)

目錄
monitor