• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
最新录用栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
专题与综述
VLSI详细布线算法研究进展
屈通, 盖天洋, 王书涵, 苏晓菁, 粟雅娟, 韦亚一
2021, 38(11): 1-6.   doi: 10.19304/J.ISSN1000-7180.2021.0030
摘要(29) HTML(14) PDF (3)
摘要:
超大规模集成电路(VLSI)中的详细布线是物理设计中一个重要且具有挑战性的环节.在这一阶段,所有导线的路径都会被确定下来,布线的优劣直接关系到芯片的面积和性能,路径搜索是布线中最为耗时的步骤之一.本文介绍了基于网格的布线模型,将布线问题抽象为一个图搜索问题或者多商品流问题;总结了迷宫搜索算法、A*算法、整数线性规划(ILP)算法和并行加速算法在路径搜索中的应用和针对设计约束作出的优化,结合在布线器中应用情况分析其优劣;总结回顾了基于机器学习求解算法的研究进展,分析了存在的问题,并对详细布线算法的发展趋势做了展望.分析表明,A*算法在布线质量、稳定性和速度等方面的综合性能较其他算法更为优异,其难点在于设计合理的布线排序策略和图模型.强化学习具有巨大的研究潜力,目前的研究仅在规模较小的设计中测试,仍需要进一步改进和探索.
人工智能与算法
融合运动轨迹特征的多模态群体行为识别方法
王世辉, 祝永新, 汪辉, 郑小盈
2021, 38(11): 7-13.   doi: 10.19304/J.ISSN1000-7180.2021.0341
摘要(26) HTML(14) PDF (1)
摘要:
群体行为识别从群体层面出发,研究群体的行为及个体的动作并进行分类.准确的群体行为识别结果对安防监控、体育视频分析等领域有重要意义.针对目前基于LSTM的群体行为识别无法充分挖掘个体间在群体层面时空特征的问题,提出一种基于LSTM-Transformer的群体-个体时空特征融合群体行为识别模型.在此基础上,首次将运动轨迹特征融入群体行为识别中,提出融合运动轨迹特征的群体行为识别模型,进一步提升模型的识别效果.实验结果表明,相比现有基于LSTM的模型,所提出模型的群体行为识别准确率提升8.3%,个体动作识别准确率提升2.1%;相比基于GCN的模型,所提出模型不仅识别效果有所提升,而且可应对群体人数变化的场景.
两阶段无监督领域自适应方法
陶洋, 杨雯, 林飞鹏, 翁善
2021, 38(11): 14-20.   doi: 10.19304/J.ISSN1000-7180.2021.0101
摘要(2) HTML(2) PDF (0)
摘要:
领域自适应问题中源域样本和目标域样本分布差异较大.传统领域自适应方法在对齐领域分布时,往往忽略样本的先验标签信息,导致投影后子空间样本判别性不足.针对该问题,提出一种两阶段无监督领域自适应方法.该方法利用标签信息使目标域子空间具有鉴别性的同时对重构矩阵施加块对角约束,得到跨域子空间中的域不变特征,提高模型分类性能.在领域自适应问题常用的三个基准数据集上进行实验,获得了较好的效果.
混沌和柯西变异的蝗虫优化算法及特征选择
兰娅勋
2021, 38(11): 21-30.   doi: 10.19304/J.ISSN1000-7180.2021.0084
摘要(23) HTML(12) PDF (0)
摘要:
传统蝗虫优化算法在处理优化问题时依然存在收敛速度慢、易陷入局部最优的不足.为此,提出了融合混沌映射和柯西变异机制的非线性蝗虫优化算法CCGOA.通过融合混沌Tent映射与反向学习机制,对种群初始化,在确保初始种群质量较优前提下,使种群尽可能均匀分布于搜索空间;利用余弦函数设计非线性自适应系数更新机制,更好均衡个体全局搜索与局部开发能力;引入柯西变异对当前最优个体进行变异扰动,避免算法陷入局部最优.通过基准函数寻优测试,证实提出的算法可以有效提升寻优精度和收敛速度.设计了特征选择算法CCGOA-FS并应用于特征选择问题求解.通过若干数据集测试,证实该算法可以有效进行最优特征子集选取,提升数据分类准确率.
网络与通讯
一种无线传感器网络最小级联移动修复方法
吴昊, 陈雯柏, 郝翠, 马航
2021, 38(11): 31-37.   doi: 10.19304/J.ISSN1000-7180.2021.0196
摘要(32) HTML(13) PDF (0)
摘要:
针对复杂应用场景中无线传感器网络节点失效导致的连通性故障问题,提出了一种最小级联移动的修复方法.当网络中某节点发生失效时,通过割点检测算法判断该失效节点是否对网络连通性造成影响.若该失效节点为割点,则认为该节点对网络连通性影响较大,需要对网络进行修复.该失效节点的邻居节点间距离若小于等于节点通信半径,通过邻居节点间直接建立通信链路的方式对网络进行修复.该失效节点的邻居节点间距离若大于节点通信半径,利用节点度与节点间欧式距离选举最佳候选节点,通过通信半径与邻居节点位置计算其待移动位置,最佳候选节点移动到位置后与其他邻居节点建立通信链路.实验结果表明,该方法能够有效对节点失效后的网络进行修复.该方法在修复过程中减少了修复节点的移动距离,降低了修复节点的能量损耗,延长了网络寿命.
基于改进差分的多障碍视觉传感器网络部署优化
吴晓鸰, 陈新阳, 骆晓伟, 凌捷
2021, 38(11): 38-44.   doi: 10.19304/J.ISSN1000-7180.2021.0046
摘要(22) HTML(13) PDF (0)
摘要:
与传统无线传感器网络(WSN)不同,视觉传感器对障碍物敏感度远高于其他传感器,障碍物直接影响视觉传感器的有效感知范围.受实际场景模型仿真的局限,目前视觉传感器网络的优化部署研究大多忽略实际多障碍情形,集中于无障碍范围内情形.建筑信息模型(Build Information Model, BIM)技术可以用来自动提供实际场景要素的几何和非几何属性,可为优化算法提供可靠的场景模型输入数据.本文提出一种BIM和分段自适应迁移差分算法(Segment Adaptive Migration Difference Evolution, SAMDE)融合框架BIM-SAMDE,并提出一种多节点有效感知区域分析算法辅助计算有效感知率,对协同视觉传感器网络在多障碍情况下的感知覆盖进行优化部署.仿真实验表明,所提出的BIM-SAMDE框架能够自动获取多障碍场景数据,模型构建更为智能化;所提出的SAMDE算法在多障碍情形的部署优化问题中寻优性能优越,收敛速度快,与其他部署优化算法相比具有一定的优势.
图像处理
一种轻量图像超分辨率重建算法
李浪, 陶洋
2021, 38(11): 45-52.   doi: 10.19304/J.ISSN1000-7180.2021.0188
摘要(23) HTML(15) PDF (2)
摘要:
目前大多数图像超分辨率重建算法都是通过堆叠卷积神经网络的深度和宽度来提升算法的重建能力.虽然这些算法能够在一定程度上提升重建效果,但是算法复杂度高.为了改善这一问题,提出一种基于注意力机制和特征融合的轻量超分辨率重建算法.首先利用像素注意力机制,对不同的特征的像素进行加权;随后利用轻量级通道注意力机制模块设计多级特征融合模块, 并通过全局残差连接进行全局的特征融合;最后对提取到的特征进行亚像素卷积上采样.将本算法在Set5、Set14、BSD100以及Urban100这四个图像超分辨率重建领域常用公开数据集上进行实验.实验结果表明,与对比算法相比,在图像评价指标上,具备更高的峰值信噪比和结构相似性;在视觉效果上,和对比算法的重建图像相比,本算法重建的图像具备更丰富的细节;同时与对比算法相比,所提算法具备最少的参数量.
基于3D NSDST和改进空间频率相结合的MRI/PET图像融合
郑伟, 安晓林, 李涵, 马泽鹏
2021, 38(11): 53-60.   doi: 10.19304/J.ISSN1000-7180.2021.0148
摘要(23) HTML(13) PDF (0)
摘要:
为解决三维核磁共振成像(Magnetic Resonance Imaging, MRI)与正电子发射断层成像(Positron Emission Tomography, PET)融合细节表达不足及能量信息不完善问题,提出了一种基于三维非下采样离散剪切波变换(3D Nonsubsampled Discrete Shearlet Transform,3D NSDST)和改进空间频率(spatial frequency,SF)相结合的图像融合方法。利用3D NSDST将MRI图像和PET图像分解为一个低频子带和若干个高频子带。低频子带取用改进SF的融合策略,自适应调节图像块的大小,同时考虑了三维空间内二十六邻域的体素信息,引入了三维拉普拉斯能量和来保留细节信息。高频子带取用脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)的融合策略,将三维拉普拉斯能量和作为输入,并用三维梯度能量作为链接强度来调节神经元。最后经3D NSDST逆变换重构图像,实现MRI/PET图像融合。实验结果表明,3D NSDST和改进空间频率相结合的融合策略可以有效保留图像中的细节信息,同时不会影响图像的整体对比度,在主观评价和客观评价上与已有算法相比具有一定优势。
计算机工程与应用
面向GNSS信道译码的RISC-V专用指令设计
秦爽, 李健, 陈杰
2021, 38(11): 61-66.   doi: 10.19304/J.ISSN1000-7180.2021.0061
摘要(22) HTML(12) PDF (0)
摘要:
随着全球卫星导航系统(GNSS)信号的增多,导航接收机需要处理的信道译码算法越来越多.传统的使用协处理器的方式虽然可以提高信道译码的速度,但是会消耗大量硬件资源.采用软件实现信道译码的方式虽然可以使用DSP、SIMD等指令集进行加速,但是这些指令集不是仅针对信道译码进行扩展的,其中大部分指令在信道译码中很少使用,因此导致信道译码效率较低.基于RISC-V指令集针对GNSS信道译码扩展7条专用指令,这些专用指令丰富了RISC-V的位操作.对比相同的信道译码程序,优化后的算法代码量降低,其中BCH译码和解交织算法代码量减少50%.gem5模拟器和自设计RISC-V处理器Nightcore验证结果表明,优化后的算法运行周期数降低,其中解交织算法降低92%.
基于FPGA的GRU神经网络飞行数据异常检测
彭井桐, 祝永新, 汪辉, 孔祥聪, 张钦润, 郭振堂
2021, 38(11): 67-73.   doi: 10.19304/J.ISSN1000-7180.2021.0103
摘要(0) HTML(2) PDF (1)
摘要:
商用大型飞机飞行数据异常检测存在实时性要求高、检测点多等难点,使用传统时间序列处理软件存在处理时间长等缺点.本文提出基于可编程阵列芯片(FPGA)的门控循环单元(GRU)异常检测神经网络, 对飞行振动数据源做时间序列分析异常检测.为满足高频采样数据的实时处理要求,对GRU的实现进行了多方面并行加速优化.一是提出一种结构化的并行优化方法.将权重参数保存在FPGA片上内存中并对数组做维度上的切割,使权重参数能在列维度上并行读取,配合对矩阵向量乘法的并行计算优化,实现GRU网络的高效计算效率.二是优化GRU网络激活函数的计算方式.使用片上内存做查找表,以流水线方式大幅减少了激活函数操作的延时和计算资源消耗.三是对GRU网络的数据通路做调整.通过优化计算顺序,消除了两组矩阵向量乘法的依赖关系,将关键延时降低了40%.测试结果表明提出的GRU飞行异常检测FPGA硬件加速器达到了高吞吐率10.33GFLOPS和低功耗2.532 w.
轻量级垃圾回收机器人的视觉跟踪系统研究
胡名鸿, 郭慧, 周邵萍, 刘亚菲
2021, 38(11): 74-80.   doi: 10.19304/J.ISSN1000-7180.2021.0259
摘要(24) HTML(14) PDF (0)
摘要:
为增加垃圾拾取机器人的自主感知能力,提出了一种用于垃圾跟踪视觉系统的基于YOLOV4改进的轻量级目标检测算法YOLO-TrashNet。针对视觉跟踪系统速度与精度权衡问题,在YOLOV4的基础上将主干网络替换为MobileNetV3,分析了SE(Squeeze-and-Excitation)注意力机制、CBAM(Convolutional Block Attention Module)注意力机制以及CSP跨级局部网络结构对算法性能带来的影响。搭建了垃圾回收机器人视觉系统,使用了能提高目标定位能力Realsense深度相机,采集了公共场所最常见的15类垃圾,完成了室内垃圾跟踪实验。实验结果表明,提出的以CSPMobileNetV3-CBAM为主干网络的模型能大幅提升检测速度,与YOLO-V4相比计算量降低了93.3%,权重大小仅为19.5 MB,内存消耗低于YOLOV4-tiny;在Jetson Nano运行环境上相比YOLO-V4的垃圾检测牺牲了4%的精度,但是速度提升了6倍,mAP为86.3%。
基于形式化模型的NC代码异常检测
潘鋆, 韩京辰, 于丹, 陈永乐
2021, 38(11): 81-87.   doi: 10.19304/J.ISSN1000-7180.2021.0224
摘要(0) HTML(1) PDF (1)
摘要:
数控机床的控制通常是使用Numerical Control (NC)代码实现.如果NC代码在传输过程中被人为修改,则会对加工的零件甚至机床造成严重安全威胁.本文提出了一种NC代码自动化异常检测方法,可以较好的保护机床.使用C语言对NC代码进行形式化建模,并以线性时序逻辑(Linear-time Temporal Logic)来对NC代码形式化模型进行异常检测,实现了对NC代码的高效自动化异常检测.实验结果表明,该方法可以有效识别出5类异常操作;具有较好的可扩展性,可用于多种数控系统.
数字电路与系统
面向自动搜索型神经网络的加速器设计与实现
贺文, 祝永新, 汪辉, 黄尊恺
2021, 38(11): 88-94.   doi: 10.19304/J.ISSN1000-7180.2021.0279
摘要(23) HTML(14) PDF (0)
摘要:
近年来,通过神经网络架构搜索(NAS)得到的自动搜索型神经网络在视觉任务中表现尤为突出,然而,其更为复杂多变的卷积规模和运算方式限制了其在边缘侧设备的应用.为解决这一问题,针对自动搜索型神经网络搜索空间中各种复杂多变的计算方式,设计了一款可加速自动搜索型神经网络的高帧率高灵活度加速器.首先,针对其丰富的卷积类型提出了阵列复用混合卷积(AMMC)结构,不新增MAC阵列就能灵活地实现不同卷积在不同方向上的并行化处理.其次,提出了一种可变精度的可配置多路选择激活(CMA)结构,有效地实现了这类网络应用的多种激活函数的高精度拟合.将MAC阵列规模为32*32的加速器部署到Xilinx的zcu102芯片上,时钟频率可达200 MHz,加速器功耗为3.2 w;移植MnasNet-a1对224×224尺寸图片处理的实际运行帧率为272.9 fps.
一种降低3-D VRRAM热串扰的并行输入重编码电路
陈之晟, 张锋
2021, 38(11): 95-100.   doi: 10.19304/J.ISSN1000-7180.2021.0258
摘要(22) HTML(14) PDF (1)
摘要:
3-D VRRAM(Vertical Resistive Random Access Memory)是一种用来降低阻变式存储器单元成本的新型架构.目前对3-D VRRAM阵列的性能评估主要集中于对写入和读取裕度的分析上.然而3-D VRRAM中的中的热串扰效应也是一个值得关注的问题,过高的热串扰会明显降低阵列中存储单元的可靠性.本文提出了一种并行输入重编码电路,通过对输入数据进行重新编码来降低大规模并行写入所引起的热串扰效应.实验结果表明,当并行写入阵列大小为4×4、4×8以及8×8时,使用本文提出的输入重编码电路可以分别降低21.8%、23.9%和12.2%的热串扰效应.此外,使用本文提出的写入重编码仅仅增加了3%的写入延时以及0.07%的额外面积.
基于2T1MTJ单元结构的STT-MRAM存内计算实现
郑志强, 陈俊杰, 颜思岑, 胡炜, 王少昊
2021, 38(11): 101-108.   doi: 10.19304/J.ISSN1000-7180.2021.0240
摘要(23) HTML(15) PDF (0)
摘要:
在处理数据密集型应用时,传统冯·诺依曼计算体系架构难以兼顾低延时与低功耗.通过数据处理架构创新,存内计算技术可有效提升处理器与内存间的通信效率并克服"内存墙"性能瓶颈.提出了一种基于2T1MTJ(双晶体管单磁隧道结)单元结构的通用型STT-MRAM(自旋转移矩磁性随机存储器)存内计算方案,通过复用存取晶体管将位逻辑运算的控制前置于阵列中,并能同时兼顾MRAM常规存储功能.结合SMIC 55nm工艺与p-MTJ紧凑模型进行了CMOS/MTJ混合仿真,并与基于1T1MTJ和2T2MTJ单元结构的同类方案进行了性能对比.结果表明,由于运用了和存储单元具有相同MTJ的单一逻辑运算参考单元,2T1MTJ方案的与/或位逻辑运算正确率和单元写入正确率在不同MTJ工艺偏差、TMR(隧穿磁阻效应)偏差、温度变化、电压波动情况下,整体优于1T1MTJ方案;相比2T2MTJ方案,提出方案的写入正确率高37.1%,单元面积减半.此外,还提出一种采用双阈值晶体管的改进型2T1MTJ单元结构方案,其读写性能均优于采用相同存取晶体管的2T1MTJ方案,其中对单元写入正确率的提升达9.4%.