特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于TF-IDF算法的文本量化方法及作者識別應(yīng)用

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘  要:作者識別任務(wù)旨在找到匿名文本的作者,在互聯(lián)網(wǎng)蓬勃發(fā)展的時(shí)代,準(zhǔn)確識別出匿名文本的作者對維護(hù)網(wǎng)絡(luò)環(huán)境的安全有著積極作用。在該任務(wù)中,文本內(nèi)容的量化非常關(guān)鍵,能直接影響作者識別的準(zhǔn)確率?;谠~頻-逆文檔頻率(TF-IDF)算法,文章提出了一種文本量化方法將文本轉(zhuǎn)變?yōu)橄蛄?。為評估閔可夫斯基距離和余弦相似度識別作者的共同作用,提出了一種混合距離用于計(jì)算兩個(gè)文本之間的距離。(剩余13435字)

目錄
monitor