特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

大規(guī)模多任務(wù)中文理解能力測試

  • 打印
  • 收藏
收藏成功


打開文本圖片集

關(guān)鍵詞:中文大模型;多任務(wù)評(píng)測;zero-shot;few-shot;垂直領(lǐng)域任務(wù)

0引言

隨著ChatGPT[1]等大模型的驚艷亮相,ChatGLM[2]、MOSS[3]、文心一言、通義千問、商量等具備中文能力的大模型也相繼發(fā)布。雖然針對(duì)英文大語言模型已有較為完善的評(píng)測方式(如MMLU[4]),但目前仍缺乏針對(duì)中文大語言模型的評(píng)測方法。(剩余5913字)

目錄
monitor