基于注意力增強的圖像識別方法*

打開文本圖片集
摘要:文章探索了一種基于注意力增強的圖像識別方法,該方法采用了ResNet-34網(wǎng)絡(luò),并引入了AB-SENet注意力增強模塊。AB-SENet模塊能夠接收輔助分支的輸出,引入更多上下文信息,自適應(yīng)地調(diào)整通道權(quán)重,使得模型能夠更有針對性地關(guān)注圖像中的關(guān)鍵特征。實驗結(jié)果表明,在CIFAR-100數(shù)據(jù)集上,相比較標準的ResNet-34網(wǎng)絡(luò)和SENet注意力機制,AB-SENet注意力增強模塊在Accuracy、Precision、Recall 和 F1 四個指標上都有明顯的增長,分別達到了78.35%、78.66%、78.35%和78.82%,在圖像分類任務(wù)中取得了更好的綜合性能,該方法對于提高圖像識別的實際應(yīng)用能力和性能具有積極的意義。(剩余5611字)