特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于img2col的2D卷積算子在DCU加速器上的并行優(yōu)化研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:深度學習中,因卷積巨大的計算需求,經常成為限制大型卷積神經網絡性能的瓶頸,為此,提出使用并行技術來優(yōu)化卷積運算的策略。對傳統(tǒng)2D卷積算子進行重構,使其轉換為通用矩陣乘法;使用共享內存和數據預取等技術,降低訪存次數;針對加速器的硬件架構,調整算法的并行方案以提高計算性能。實驗結果表明,相較傳統(tǒng)的計算方式,該優(yōu)化策略將運算速度提升了近7.5倍,提高了卷積運算效率。(剩余9317字)

monitor