特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于增強(qiáng)數(shù)據(jù)生成的新聞文本實(shí)體識別

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:近年來,預(yù)訓(xùn)練語言模型的出現(xiàn)極大地推動了新聞文本實(shí)體識別領(lǐng)域的發(fā)展。然而,高質(zhì)量、大規(guī)模標(biāo)注數(shù)據(jù)的匱乏仍然是制約模型性能提升的關(guān)鍵因素。文章針對此問題設(shè)計(jì)了一種增強(qiáng)數(shù)據(jù)生成框架,該框架基于預(yù)訓(xùn)練語言模型,利用關(guān)鍵詞選擇和動態(tài)遮蓋的方法構(gòu)建損壞文本,再通過文本重構(gòu)和數(shù)據(jù)選擇生成多樣化且連貫的增強(qiáng)數(shù)據(jù)。(剩余7914字)

目錄
monitor