注冊(cè)帳號(hào)丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁(yè)右上角的“充值”按鈕可以為您的帳號(hào)充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購(gòu)買(mǎi)網(wǎng)站上的任意文章或雜志的電子版
4.購(gòu)買(mǎi)后文章、雜志可在個(gè)人中心的訂閱/零買(mǎi)找到
5.登陸后可閱讀免費(fèi)專(zhuān)區(qū)的精彩內(nèi)容
打開(kāi)文本圖片集
一、引言
隨著人工智能技術(shù)的快速發(fā)展,對(duì)話(huà)系統(tǒng)在人機(jī)交互、智能助理和客戶(hù)服務(wù)等領(lǐng)域嶄露頭角,成為促進(jìn)人機(jī)溝通的關(guān)鍵技術(shù)之一。對(duì)話(huà)系統(tǒng)場(chǎng)景可以建模成為馬爾可夫決策過(guò)程(Markov Decision Process,MDP),而強(qiáng)化學(xué)習(xí)也是在馬爾可夫決策過(guò)程基礎(chǔ)上發(fā)展起來(lái)的,所以利用強(qiáng)化學(xué)習(xí)解決對(duì)話(huà)系統(tǒng)場(chǎng)景有著天然的優(yōu)勢(shì)。(剩余3082字)
登錄龍?jiān)雌诳W(wǎng)
購(gòu)買(mǎi)文章
基于深度強(qiáng)化學(xué)習(xí)的對(duì)話(huà)系統(tǒng)研究
文章價(jià)格:4.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會(huì)員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話(huà):400-106-1235
舉報(bào)郵箱:longyuandom@163.com