BERTopic在醫(yī)療領域文章主題挖掘中的應用與分析

打開文本圖片集
摘要:文章采用BERTopic模型,對“好大夫在線”平臺上的醫(yī)學科普文章進行主題挖掘,旨在提升患者檢索醫(yī)療信息的效率,并輔助醫(yī)療從業(yè)者精準把握醫(yī)學話題的發(fā)展趨勢,進而推動醫(yī)療事業(yè)的進步。針對醫(yī)學文本信息量大、專業(yè)性強的特點,研究通過數據預處理、預訓練嵌入模型ERNIE-Health,并細致調整模型參數,有效地解決了傳統(tǒng)LDA(Latent Dirichlet Allocation)模型在醫(yī)學文本處理任務中存在的局限性。(剩余7467字)