注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要: 針對圖書智能分揀系統(tǒng)中的分揀車路徑規(guī)劃問題,提出一種基于深度強化學(xué)習(xí)框架和競爭雙深度Q網(wǎng)絡(luò)路徑規(guī)劃算法。將分揀車的路徑規(guī)劃問題構(gòu)建成馬爾可夫決策過程,然后通過結(jié)合競爭Q網(wǎng)絡(luò)和雙深度Q網(wǎng)絡(luò)構(gòu)建競爭雙深度Q網(wǎng)絡(luò)(D3QN),進而在避免過估計的同時,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。最后,通過設(shè)計智能代理的狀態(tài)、動作和獎勵函數(shù),并采用動態(tài)[ε?]貪婪算法和衰減式學(xué)習(xí)率策略,使智能代理能夠快速地選擇最優(yōu)動作,縮短完成預(yù)定卸載的移動路徑,降低碰撞障礙物的概率。(剩余12544字)
登錄龍源期刊網(wǎng)
購買文章
基于深度強化學(xué)習(xí)的圖書分揀車的路徑規(guī)劃
文章價格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:longyuandom@163.com