特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于Python和Selenium的期刊論文施引側(cè)數(shù)據(jù)挖掘程序設(shè)計(jì)

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘 要:為了研究中文科技期刊被國(guó)際期刊“施引側(cè)”的引用行為,采用Python+Selenium+Chrome組合框架設(shè)計(jì)了WhoCiteMe程序,提出一種期刊論文施引側(cè)引用信息的數(shù)據(jù)挖掘方法.文章提出了WhoCiteMe程序的設(shè)計(jì)思路,并分析了廣東省10種中文科技期刊被國(guó)際期刊引用次數(shù)、學(xué)科分布、施引期刊的分區(qū)等特征.結(jié)果表明:提出的算法和設(shè)計(jì)的數(shù)據(jù)挖掘程序,可以獲取國(guó)際期刊施引文獻(xiàn)清單及引用數(shù)據(jù),為評(píng)價(jià)中文科技期刊的國(guó)際影響力提供個(gè)性化數(shù)據(jù),為辦刊決策提供數(shù)據(jù)支撐.

關(guān)鍵詞:科技期刊;施引側(cè);數(shù)據(jù)挖掘;Python;Selenium

中圖分類號(hào):G 255.2  文獻(xiàn)標(biāo)識(shí)碼:A  文章編號(hào):1007-6883(2024)06-0094-11

DOI:10.19986/j.cnki.1007-6883.2024.06.013

科技期刊承載著科學(xué)研究成果的傳播重任,是學(xué)術(shù)交流的主流宣傳陣地,在促進(jìn)學(xué)科發(fā)展與社會(huì)進(jìn)步中起到重要作用.如何提升中文科技期刊的學(xué)術(shù)影響力(特別是國(guó)際影響力),已成為期刊界共同關(guān)注的熱點(diǎn).如何采用量化指標(biāo)定量評(píng)價(jià)和衡量各類期刊發(fā)展資助項(xiàng)目的投入、實(shí)施措施對(duì)提升期刊國(guó)際影響力的貢獻(xiàn),一直是辦刊人共同關(guān)注的研究熱點(diǎn).2020年,中國(guó)科學(xué)技術(shù)協(xié)會(huì)支持的多家研究機(jī)構(gòu)聯(lián)合攻關(guān)項(xiàng)目提出了“科技期刊世界影響力指數(shù)(World Journal Clout Index of Scientific and Technological Periodicals,WJCI)”[1],引入總被引頻次與影響因子雙指標(biāo)(WAJCI)、量效指數(shù)(JMI)、網(wǎng)絡(luò)影響力指標(biāo)(WI),基于“同類可比”原則,提出一套綜合評(píng)價(jià)體系,避免了使用“影響因子”單一指數(shù)評(píng)價(jià)的局限性,使期刊的國(guó)際影響力評(píng)價(jià)更全面、更客觀.胡小洋等[2]基于國(guó)際他引影響因子、國(guó)際即年指標(biāo)、可被引文獻(xiàn)量等數(shù)據(jù),提出一種基于改進(jìn)的DID模型和學(xué)術(shù)期刊綜合表現(xiàn)力指數(shù),用以構(gòu)建對(duì)學(xué)術(shù)期刊資助項(xiàng)目實(shí)施效果的評(píng)價(jià)方法,該方法在學(xué)術(shù)期刊自主項(xiàng)目實(shí)施效果評(píng)價(jià)實(shí)踐中具有推廣價(jià)值.目前各類科技期刊的評(píng)價(jià)體系均基于被引數(shù)據(jù),而基于“施引側(cè)”的數(shù)據(jù)分析較少.2021年,徐琳宏等[3]以自然語言處理領(lǐng)域?yàn)槔?,嘗試在施引文獻(xiàn)視角下研究了正面引用和中性引用論文的影響力差異及其影響因素,以期矯正因引用同一化問題而導(dǎo)致的僅以被引頻次評(píng)估帶來的偏差.2023年,F(xiàn)rancis等[4]針對(duì)目前包括Web of Science在內(nèi)的幾乎所有數(shù)據(jù)庫都從“被引側(cè)”(Cited side)設(shè)置文獻(xiàn)計(jì)量指標(biāo)的現(xiàn)狀,首次提出“施引側(cè)”(Citing side)文獻(xiàn)計(jì)量指標(biāo)設(shè)置的可行性,探討其優(yōu)勢(shì)與應(yīng)用,并建議文獻(xiàn)計(jì)量指標(biāo)由“被引側(cè)”轉(zhuǎn)向“施引側(cè)”將提高文獻(xiàn)計(jì)量指標(biāo)的實(shí)用性、及時(shí)性.

生成式人工智能時(shí)代(GenAI Era)的到來為學(xué)術(shù)研究和出版帶來了機(jī)遇與挑戰(zhàn)[5],學(xué)術(shù)研究過程以及施引行為將變得更加撲朔迷離,單純考察被引次數(shù)的影響因子不足以了解期刊論文的學(xué)術(shù)價(jià)值.Python數(shù)據(jù)挖掘與分析可為各行各業(yè)提供決策[6-7].盡管CiteSpace軟件可以分別對(duì)中文文獻(xiàn)、英文文獻(xiàn)進(jìn)行知識(shí)圖譜分析,但無法挖掘中文論文被外文期刊施引數(shù)據(jù),不能滿足單篇論文和單本期刊的個(gè)性化數(shù)據(jù)分析需求。(剩余9067字)

monitor