基于組稀疏優(yōu)化的強化學(xué)習(xí)稀疏表征

打開文本圖片集
摘要:強化學(xué)習(xí)由于具有出色的數(shù)據(jù)效率和快速學(xué)習(xí)的能力,開始應(yīng)用于許多實際問題以學(xué)習(xí)復(fù)雜策略。但是高維環(huán)境中的強化學(xué)習(xí)常常受限于維度災(zāi)難或者災(zāi)難性干擾,性能表現(xiàn)不佳甚至導(dǎo)致學(xué)習(xí)失敗。圍繞表征學(xué)習(xí),提出了一種符合Lasso 類型優(yōu)化的稀疏卷積深度強化學(xué)習(xí)方法。首先,對稀疏表征的理論和優(yōu)勢進行綜述,將稀疏卷積方法引入深度強化學(xué)習(xí)中,提出了一種新的稀疏表征方法;其次,對由稀疏卷積編碼定義的可微優(yōu)化層進行了數(shù)學(xué)推導(dǎo)并給出了優(yōu)化算法,為了驗證新的稀疏表征方法的有效性,將其應(yīng)用于相關(guān)文獻(xiàn)常見的基準(zhǔn)環(huán)境中進行測試。(剩余8514字)