您的位置: 首页 > 中文期刊论文 > 详情页

高性能YOLOv3-tiny嵌入式硬件加速器的混合优化设计

作   者:
谭会生肖鑫凯卿翔
作者机构:
湖南工业大学轨道交通学院
关键词:
硬件混合优化YOLOv3-tiny网络硬件加速器数据复制上采样异构平台动态配置架构
期刊名称:
半导体技术
i s s n:
1003-353X
年卷期:
2025 年 50 卷 001 期
页   码:
55-63
摘   要:
为解决在嵌入式设备中部署神经网络受算法复杂度、执行速度和硬件资源约束的问题,基于Zynq异构平台,设计了一个高性能的YOLOv3-tiny网络硬件加速器。在算法优化方面,将卷积层和批归一化层融合,使用8 bit量化算法,简化了算法流程;在加速器架构设计方面,设计了可动态配置的层间流水线和高效的数据传输方案,缩短了推理时间,减小了存储资源消耗;在网络前向推理方面,针对卷积计算,基于循环展开策略,设计了8通道并行流水的卷积模块;针对池化计算,采用分步计算策略实现对连续数据流的高效处理;针对上采样计算,提出了基于数据复制的2倍上采样方法。实验结果表明,前向推理时间为232 ms,功耗仅为2.29 W,系统工作频率为200 MHz,达到了23.97 GOPS的实际算力。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充