近年来,以神经网络、边缘计算为代表的机器学习逐渐成为运行在硬件之上的感知算法。当前,边缘计算深度神经网络(DNN)已被广泛地用于各种类型的智能感知任务,包括图像识别、语义分割、语音识别、自主构图与导航、自然语言处理等。在这些技术中,图像识别技术已经比较成熟,Resnet和Densenet在性能上超越人类。但更复杂的任务,例如自主的建图和导航、语义分割等,目前仍然有很大的发展空间,而这些任务正是自动驾驶和机器人等应用的关键算法之一。
MASK-RCNN是最近流行的一种通用的对象实例分割框架,MASKR-CNN是以fasterR-CNN为基础,通过增加一个分支来对边界框进行识别。MaskR-CNN训练简单,对R-CNN的加速速度达到5fps,并且在精度上有着不错的表现。
在SLAM方面,回环检测与多传感器数据融合是其两大难点。一种语义SLAM,称为DS-SLAM,用于动态环境。并行运行DS-SLAM中的5个线程:跟踪、语义分段、局部映射、循环关闭和密集语义映射创建,采用语义分割网络和移动一致性检查方法来降低动态对象的影响,大大提高动态环境下的定位精度;同时,DS-SLAM生成密集的八叉树映射,可用于后续高级任务。
尽管边缘计算DNN在许多任务上的精确度达到前所未有的水平,但是由于边缘计算DNN对现有硬件架构的训练难度很大,部分算法方面的研究已经从主要关注准确率转向关注算法是否适合硬件实现。在边缘计算DNN中,模型大小对系统的性能、扩展性和能源效率有重要影响。称重裁剪可以获得较好的压缩比,但有3个明显的缺点:
(1)裁剪网状结构不规则,影响工作效率和产量;
(2)训练复杂度增加,难以从头开始;
(3)缺乏严格的压缩比和推理精度保障。
针对上述不足,边缘计算提出CirCNN,一种利用块循环矩阵表示权值和处理神经网络的原理方法。CirCNN采用基于快速傅里叶变换(FFT)的快速乘法,将计算复杂度由O(n2)降为O(nlogn),并将存储的复杂性从O(n2)降低到O(n),精度损失可以忽略。