注冊帳號丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費(fèi)
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要: 針對高動態(tài)戰(zhàn)場態(tài)勢下防御作戰(zhàn)場景中的多目標(biāo)火力規(guī)劃問題,提出一種基于近端策略優(yōu)化算法的火力規(guī)劃方法,以最大化作戰(zhàn)效能為目標(biāo),從彈藥消耗、作戰(zhàn)效果、作戰(zhàn)成本及作戰(zhàn)時間4個方面設(shè)計強(qiáng)化學(xué)習(xí)獎勵函數(shù)。考慮歷史決策序列對當(dāng)前規(guī)劃的影響,以長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)為核心,基于Actor-Critic框架設(shè)計神經(jīng)網(wǎng)絡(luò),使用近端策略優(yōu)化算法訓(xùn)練網(wǎng)絡(luò),利用訓(xùn)練好的強(qiáng)化學(xué)習(xí)智能體進(jìn)行序貫決策,根據(jù)多個決策階段的態(tài)勢實(shí)時生成一系列連貫火力規(guī)劃方案。(剩余20466字)
登錄龍源期刊網(wǎng)
購買文章
基于PPO算法的集群多目標(biāo)火力規(guī)劃方法
文章價格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com