首页出版说明中文期刊中文图书环宇英文官网付款页面

基于 FPGA 硬件加速 CNN 目标识别

赖 瀚昀, 郑 小海, 王 露曼
西京学院

摘要


为提高计算速度卷积神经网络(CNN)用于目标识别任务,本文研究了现场可编程门阵列(FPGA)在加速 CNN
目标识别中的应用。FPGA 以其硬件可重构性、低延迟和高效能效比,在模型的适应性方面展现出显著优势。本研究选用
了 YOLOv3 作为 CNN 模型,通过 FPGA 实现目标识别的加速,通过软硬件协同工作流程,实现了深度学习模型的高效加速。
本文介绍了基于 FPGA 的卷积运算设计,包括多通道卷积运算和 DSP48 完成卷积乘法的优化策略。实验结果表明,该系统
表现出良好的目标检测效果,在资源消耗和功耗方面具有优势,低功耗特性更适合嵌入式系统。

关键词


现场可编程门阵列;目标识别;嵌入式系统;YOLOv3

全文:

PDF


参考


[ 1 ] Q I U J , S O N G S , W A N G Y , e t a l . G o i n g d e e p e r

with embedded FPGA platform for convolutional neural

n e t w o r k [ C ] / / t h e 2 0 1 6 A C M / S I G D A I n t e r n a t i o n a l

Symposium,ACM,2016:26-35.

[2] 李 林,张盛兵,吴 娟 . 基于深度学习的实时图像图

像目标检测系统设计 [J]. 计算计算机测量与控制,2019,27

(7):15-19.

[3] GAREA A S, HERAS D B, ARGUELLO F. Caffe CNN

based classification of hyperspectral images on GPU[J].The

Journal of Supercomputing, 2019,75(3):1065-1077

[4] LI Z G,WANG JT. An improved algorithm for deep

learning YOLO network based on Xilinx ZYNQ FPGAC[C]//2020

International Conference on Culture-oriented Science &

Technology(ICOST). Beijing: IEEE, 2020:447-451.




DOI: http://dx.doi.org/10.12361/2661-376X-06-10-165188

Refbacks

  • 当前没有refback。