特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

混合動力系統(tǒng)偏好強化學(xué)習(xí)能量管理策略研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要: 為實現(xiàn)混合動力系統(tǒng)在電池荷電狀態(tài)(state of charge,SOC)平衡以及動力性約束下的經(jīng)濟性提升,提出了基于偏好強化學(xué)習(xí)的混合動力能量管理策略,該策略將能量管理問題建模為馬爾科夫決策過程,采用深度神經(jīng)網(wǎng)絡(luò)建立輸入狀態(tài)值到最優(yōu)動作控制輸出的函數(shù)映射關(guān)系。與傳統(tǒng)的強化學(xué)習(xí)控制算法相比,偏好強化學(xué)習(xí)算法無需設(shè)定回報函數(shù),只需對多動作進行偏好判斷即可實現(xiàn)網(wǎng)絡(luò)訓(xùn)練收斂,克服了傳統(tǒng)強化學(xué)習(xí)方法中回報函數(shù)加權(quán)歸一化設(shè)計難題。(剩余11795字)

monitor