基于 FPGA 硬件加速 CNN 目标识别
摘要
为提高计算速度卷积神经网络(CNN)用于目标识别任务,本文研究了现场可编程门阵列(FPGA)在加速 CNN
目标识别中的应用。FPGA 以其硬件可重构性、低延迟和高效能效比,在模型的适应性方面展现出显著优势。本研究选用
了 YOLOv3 作为 CNN 模型,通过 FPGA 实现目标识别的加速,通过软硬件协同工作流程,实现了深度学习模型的高效加速。
本文介绍了基于 FPGA 的卷积运算设计,包括多通道卷积运算和 DSP48 完成卷积乘法的优化策略。实验结果表明,该系统
表现出良好的目标检测效果,在资源消耗和功耗方面具有优势,低功耗特性更适合嵌入式系统。
目标识别中的应用。FPGA 以其硬件可重构性、低延迟和高效能效比,在模型的适应性方面展现出显著优势。本研究选用
了 YOLOv3 作为 CNN 模型,通过 FPGA 实现目标识别的加速,通过软硬件协同工作流程,实现了深度学习模型的高效加速。
本文介绍了基于 FPGA 的卷积运算设计,包括多通道卷积运算和 DSP48 完成卷积乘法的优化策略。实验结果表明,该系统
表现出良好的目标检测效果,在资源消耗和功耗方面具有优势,低功耗特性更适合嵌入式系统。
关键词
现场可编程门阵列;目标识别;嵌入式系统;YOLOv3
全文:
PDF参考
[ 1 ] Q I U J , S O N G S , W A N G Y , e t a l . G o i n g d e e p e r
with embedded FPGA platform for convolutional neural
n e t w o r k [ C ] / / t h e 2 0 1 6 A C M / S I G D A I n t e r n a t i o n a l
Symposium,ACM,2016:26-35.
[2] 李 林,张盛兵,吴 娟 . 基于深度学习的实时图像图
像目标检测系统设计 [J]. 计算计算机测量与控制,2019,27
(7):15-19.
[3] GAREA A S, HERAS D B, ARGUELLO F. Caffe CNN
based classification of hyperspectral images on GPU[J].The
Journal of Supercomputing, 2019,75(3):1065-1077
[4] LI Z G,WANG JT. An improved algorithm for deep
learning YOLO network based on Xilinx ZYNQ FPGAC[C]//2020
International Conference on Culture-oriented Science &
Technology(ICOST). Beijing: IEEE, 2020:447-451.
DOI: http://dx.doi.org/10.12361/2661-376X-06-10-165188
Refbacks
- 当前没有refback。