开放期刊系统

基于 FPGA 硬件加速 CNN 目标识别

赖瀚昀, 郑小海, 王露曼
西京学院

摘要

为提高计算速度卷积神经网络（CNN）用于目标识别任务，本文研究了现场可编程门阵列（FPGA）在加速 CNN
目标识别中的应用。FPGA 以其硬件可重构性、低延迟和高效能效比，在模型的适应性方面展现出显著优势。本研究选用
了 YOLOv3 作为 CNN 模型，通过 FPGA 实现目标识别的加速，通过软硬件协同工作流程，实现了深度学习模型的高效加速。
本文介绍了基于 FPGA 的卷积运算设计，包括多通道卷积运算和 DSP48 完成卷积乘法的优化策略。实验结果表明，该系统
表现出良好的目标检测效果，在资源消耗和功耗方面具有优势，低功耗特性更适合嵌入式系统。

关键词

现场可编程门阵列；目标识别；嵌入式系统；YOLOv3

全文:

PDF

参考

[ 1 ] Q I U J , S O N G S , W A N G Y , e t a l . G o i n g d e e p e r

with embedded FPGA platform for convolutional neural

n e t w o r k [ C ] / / t h e 2 0 1 6 A C M / S I G D A I n t e r n a t i o n a l

Symposium,ACM,2016:26-35.

[2] 李林，张盛兵，吴娟 . 基于深度学习的实时图像图

像目标检测系统设计 [J]. 计算计算机测量与控制，2019，27

（7）:15-19.

[3] GAREA A S, HERAS D B, ARGUELLO F. Caffe CNN

based classification of hyperspectral images on GPU[J].The

Journal of Supercomputing, 2019,75(3):1065-1077

[4] LI Z G,WANG JT. An improved algorithm for deep

learning YOLO network based on Xilinx ZYNQ FPGAC[C]//2020

International Conference on Culture-oriented Science &

Technology(ICOST). Beijing: IEEE, 2020:447-451.

DOI: http://dx.doi.org/10.12361/2661-376X-06-10-165188

Refbacks

当前没有refback。

合作支持单位

新加坡万仕出版社
北京春城教育出版物研究中心
马来西亚唐博科学研究院
北京万象兴荣科技文化发展有限公司
新加坡亿科出版社
春城(成都)文化传媒有限公司

基于 FPGA 硬件加速 CNN 目标识别

摘要

关键词

全文:

参考

Refbacks

合作支持单位

数据库合作单位

环宇中文期刊

友情链接

联系环宇

用户名
密码
记住我