特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于隱性句逗號(hào)識(shí)別的漢語(yǔ)長(zhǎng)句機(jī)器翻譯

  • 打印
  • 收藏
收藏成功


打開(kāi)文本圖片集

提 要:長(zhǎng)句翻譯一直是機(jī)器翻譯的難題。本文根據(jù)漢語(yǔ)中相當(dāng)數(shù)量的逗號(hào)和句號(hào)可相互轉(zhuǎn)化的特點(diǎn),提出“隱性句號(hào)”和“隱性逗號(hào)”概念,并實(shí)現(xiàn)其自動(dòng)識(shí)別,以將漢語(yǔ)長(zhǎng)句變?yōu)槎叹溆糜跐h英機(jī)器翻譯。為此,首先通過(guò)人工與半監(jiān)督學(xué)習(xí)結(jié)合方法構(gòu)建一個(gè)隱性句逗數(shù)據(jù)集,實(shí)現(xiàn)基于預(yù)訓(xùn)練模型的隱性句逗識(shí)別方法,其中性能最好的Hierarchical BERT作為后續(xù)應(yīng)用模型。(剩余17546字)

monitor