基于自然語言處理和機器學(xué)習(xí)的產(chǎn)業(yè)用地性質(zhì)的識別

打開文本圖片集
摘 要:在產(chǎn)業(yè)用地信息梳理的過程中,首先需要確定地塊的底數(shù),其中圖斑所在土地的用地性質(zhì)是關(guān)鍵信息。由于一些早期的紙質(zhì)信息對相關(guān)信息的關(guān)鍵字缺少明確標(biāo)識,所以只能浪費很多人力和時間去閱讀這些紙質(zhì)內(nèi)容或者掃描文件中的數(shù)據(jù),最后進行人工判斷、總結(jié)。現(xiàn)基于自然語言處理和機器學(xué)習(xí),通過引入重要詞權(quán)重構(gòu)建改進型樸素貝葉斯模型,對需要的土地信息進行識別,并和實際正確的信息比較。(剩余5632字)