大語言模型時代Text-to-SQL 更準(zhǔn)確的評估指標(biāo)
摘要:大型語言模型(LLM) 已成為推進(jìn) Text-to-SQL 任務(wù)的強(qiáng)大工具。研究發(fā)現(xiàn),基于 LLM 的模型在不同評估指標(biāo)下,其性能表現(xiàn)與經(jīng)過微調(diào)的模型存在顯著差異。因此,文章分析了測試套件執(zhí)行準(zhǔn)確度(EXE) 和精確集匹配準(zhǔn)確度(ESM) 在評估基于 LLM 的 Text-to-SQL 模型時的不足,并提出了改進(jìn)指標(biāo) EESM(Enhanced Exact Set Matching) 。(剩余7769字)
-
-
- 電腦知識與技術(shù)
- 2025年01期
目錄
- 基于跨模態(tài)注意力機(jī)制的多模態(tài)情...
- 基于改進(jìn)YOLOv7-Byte...
- 面向中文電子病歷的醫(yī)療問答系統(tǒng)...
- 基于深度學(xué)習(xí)的目標(biāo)檢測與識別系...
- 心理健康狀態(tài)的情感分類與預(yù)測研...
- 基于增強(qiáng)數(shù)據(jù)生成的新聞文本實體...
- 基于顏色通道區(qū)間映射縮減的HO...
- 基于 PointNet++ 的...
- 基于通道分離卷積的心電肢體電極...
- 基于CNN-GRU 和注意力機(jī)...
- 基于Java語言面向小微企業(yè)系...
- 基于農(nóng)產(chǎn)品溯源的電子商務(wù)平臺設(shè)...
- 基于Android 的學(xué)生校園...
- 自動改卷系統(tǒng)的設(shè)計與研究...
- 采用微服務(wù)技術(shù)框架助力企業(yè)資產(chǎn)...
- 基于數(shù)字化管理平臺的醫(yī)療設(shè)備精...
- 基于圖論的高職院校補(bǔ)考排考算法...
- 一種配電設(shè)備軟件智能升級方法研...
- 信息化企業(yè)合同管理系統(tǒng)的設(shè)計與...
- 內(nèi)控環(huán)境下高校經(jīng)濟(jì)數(shù)據(jù)中心建設(shè)...
- 大語言模型時代Text-to-...
- 基于協(xié)同過濾和內(nèi)容的推薦算法在...
- 基于基層醫(yī)院的四級電子病歷系統(tǒng)...
- 基于SPSS 的非線性分段擬合...
- 5G 技術(shù)在海洋油氣開采中的應(yīng)...
- 智慧養(yǎng)老服務(wù)體系中的網(wǎng)絡(luò)安全關(guān)...
- 路由協(xié)議安全性對比分析...
- 基于可信執(zhí)行環(huán)境的區(qū)塊鏈隱私保...
- 人工智能技術(shù)在計算機(jī)網(wǎng)絡(luò)安全防...
- 基于5G 的工業(yè)園區(qū)碳排放監(jiān)測...
- 基于FPGA 光柵數(shù)據(jù)采集卡設(shè)...
- 基于ESP8266 的智能家居...
- 基于機(jī)器視覺的導(dǎo)電片尺寸測量系...
- 一種便攜式心率血氧體溫檢測系統(tǒng)...
- 融合數(shù)據(jù)與知識的軸承智能故障診...
- 基于虛擬現(xiàn)實技術(shù)的客家古建筑永...
- 基于無人機(jī)傾斜攝影技術(shù)的建筑單...
- 基于數(shù)字化技術(shù)的智能AGV 實...
- 在線健康社區(qū)知識分享研究進(jìn)展...
- 課程思政與專創(chuàng)融合在數(shù)據(jù)挖掘技...
- 基于OBE 理念的計算機(jī)組成原...
- 融合概率論知識的Java 程序...
- 應(yīng)用型高校C++程序設(shè)計課程的...
- 高職計算機(jī)教育融入人工智能的探...
- 基于場景比擬的存儲器管理教學(xué)設(shè)...
- 基于OBE 理念的高校計算機(jī)公...
- 福格行為模型在C 語言實驗教學(xué)...
- 大數(shù)據(jù)背景下的計算機(jī)課程分層教...
- “雙線”混合教學(xué)質(zhì)量保障體系模...
- 新工科背景下高校開放實驗室建設(shè)...
- 基于“三教改革”的OMO混合式...
- “課程思政”視域下電子信息類專...