注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要: 為實現(xiàn)混合動力系統(tǒng)在電池荷電狀態(tài)(state of charge,SOC)平衡以及動力性約束下的經(jīng)濟性提升,提出了基于偏好強化學(xué)習(xí)的混合動力能量管理策略,該策略將能量管理問題建模為馬爾科夫決策過程,采用深度神經(jīng)網(wǎng)絡(luò)建立輸入狀態(tài)值到最優(yōu)動作控制輸出的函數(shù)映射關(guān)系。與傳統(tǒng)的強化學(xué)習(xí)控制算法相比,偏好強化學(xué)習(xí)算法無需設(shè)定回報函數(shù),只需對多動作進行偏好判斷即可實現(xiàn)網(wǎng)絡(luò)訓(xùn)練收斂,克服了傳統(tǒng)強化學(xué)習(xí)方法中回報函數(shù)加權(quán)歸一化設(shè)計難題。(剩余11795字)
登錄龍源期刊網(wǎng)
購買文章
混合動力系統(tǒng)偏好強化學(xué)習(xí)能量管理策略研究
文章價格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com