特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于深度強(qiáng)化學(xué)習(xí)的智能網(wǎng)聯(lián)車(chē)匝道合并策略

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

摘要:針對(duì)高速公路智能網(wǎng)聯(lián)汽車(chē)(CAV)匝道合并時(shí)的協(xié)同決策問(wèn)題,提出了一種基于近端策略優(yōu)化(PPO)改進(jìn)的協(xié)作深度強(qiáng)化學(xué)習(xí)算法(C-PPO)。首先,基于強(qiáng)化學(xué)習(xí)構(gòu)建CAV匝道合并場(chǎng)景下的馬爾科夫決策過(guò)程(MDP)模型,接著設(shè)計(jì)了一個(gè)新穎的協(xié)作機(jī)制,即在策略更新過(guò)程中的多個(gè)時(shí)期動(dòng)態(tài)考慮匝道附近CAV的策略更新信息,這一過(guò)程可以協(xié)調(diào)地調(diào)整優(yōu)勢(shì)值以實(shí)現(xiàn)匝道合并車(chē)輛之間的協(xié)作。(剩余5986字)

目錄
monitor