Ko-LLaMA：基于LLaMA的朝鮮語大語言模型

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

提要：在本文中，我們通過擴展LLaMA現(xiàn)有的詞表，增加額外的20，000個朝鮮語Token，從而提高其對朝鮮語的編碼和語義理解的能力；并且進一步使用朝鮮語數(shù)據(jù)進行繼續(xù)預(yù)訓(xùn)練，使用朝鮮語指令微調(diào)數(shù)據(jù)集對模型進行SFT（Supervised Fine-Tuning），并分析不同數(shù)據(jù)量對指令精調(diào)效果的影響，經(jīng)過繼續(xù)預(yù)訓(xùn)練和指令微調(diào)后的模型顯著提高了理解和遵循朝鮮語指令的能力。（剩余15089字）

試讀結(jié)束

購買全文6.00元下一篇基于語料庫的朝鮮語命名實體結(jié)構(gòu)特征研究

外語學(xué)刊

2025年01期

￥4.80/本

特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

Ko-LLaMA：基于LLaMA的朝鮮語大語言模型