注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要:深度強化學習的通用插件是一種可附加于大部分原生算法之上,并與其他種類插件兼容的算法類型。根據(jù)環(huán)境的不同,原生算法加入合適的插件后形成了不同的變體,并在訓(xùn)練速度、穩(wěn)定性等方面取得了更好的效果。根據(jù)各類變體包含的通用插件在訓(xùn)練流程中的共性,將它們分為了6類,包括通用網(wǎng)絡(luò)模型、內(nèi)在獎勵、經(jīng)驗回放、自我博弈、模仿學習和課程學習。(剩余21973字)
登錄龍源期刊網(wǎng)
購買文章
深度強化學習的通用插件研究綜述
文章價格:6.00元
當前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com