特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

面向飛騰處理器平臺的快速卷積算法優(yōu)化

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:為解決卷積神經(jīng)網(wǎng)絡(luò)難以在計算資源受限設(shè)備上部署的問題,面向國產(chǎn)FT-2000/4 多核處理器提出一種高性能的快速卷積算法FastInfer。采用分塊策略優(yōu)化通用矩陣乘法,將處理器訪問頻率高的數(shù)據(jù)存入更靠近處理器的緩存中,從而提高計算過程中的訪存效率。配合分塊方案設(shè)計實現(xiàn)高性能的矩陣乘法微內(nèi)核,使用向量外積運算更新數(shù)據(jù),提高計算訪存比,實現(xiàn)最大程度掩蓋訪存指令的延遲。(剩余1783字)

monitor