基于深度強(qiáng)化學(xué)習(xí)算法的火力-目標(biāo)分配方法

打開文本圖片集
引用格式:
李偉光,陳棟.
基于深度強(qiáng)化學(xué)習(xí)算法的火力-目標(biāo)分配方法
.指揮控制與仿真,2024,46(3):62-69.
LI W G,CHEN D.
Firepower-target assignment method based on deep reinforcement learning algorithm
.Command Control & Simulation,2024,46(3):62-69.
摘 要:針對火力-目標(biāo)分配問題解空間較大、離散、非線性等特點(diǎn),提出了一種基于DQN的深度強(qiáng)化學(xué)習(xí)算法,通過將6層全連接前饋神經(jīng)網(wǎng)絡(luò)與Q-learning算法相結(jié)合,充分發(fā)揮了深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力,通過模型性能測試對比,該方法擬合能力較強(qiáng)、收斂速度較快、方差抖動性較小,并通過實(shí)際作戰(zhàn)場景對算法進(jìn)行了驗(yàn)證,所得的分配結(jié)果符合作戰(zhàn)期望,可為指揮員火力打擊分配問題決策提供一定參考。(剩余11303字)