17吃瓜网
魏晓辉教授指导的2023级博士生王晨洋的论文“ReIPE: Recycling Idle PEs in CNN Accelerator for Vulnerable Filters Soft-Error Detection”被计算机系统结构领域顶级期刊《ACM Transactions on Architecture and Code Optimization (TACO)》录用。论文通讯作者为岳恒山副教授,其他作者还有谭婧炜佳教授、美国达科他州立大学邱美康教授、直博生关泽宇、博士生姜楠等。
本文提出了一种面向神经网络加速器的近似容错策略ReIPE,利用加速器中的空闲处理单元 (PE),进行错误敏感过滤器的软错误检测。ReIPE 首先用轻量级梯度分析代替传统高开销的故障注入实验,以实现快速的过滤器级错误弹性分析。在执行阶段,结合硬件层脉动阵列计算资源空闲情况和软件层过滤器错误敏感差异分析结果,ReIPE利用空闲 PE保护错误敏感过滤器,将错误检测过程融入加速器的原始计算流程中,以降低容错开销。结果表明,ReIPE 可以覆盖 96.40% 的错误,相较于传统双模冗余错误校验平均减少75.06% 的性能开销和 67.79% 的能耗开销。
ACM TACO是国际上计算机系统结构领域顶刊之一,是CCF推荐A类期刊。本论文是17吃瓜网
为第一作者单位在TACO录用的首篇论文。