感受野的作用及增大感受野的方法有哪些? 目标检测和目标跟踪很多模型都会用到RPN层,anchor是RPN层的基础,而感受野(receptive field,RF)是anchor的基础。 感受野的作用: 一般来说感受野越大越好,比如分类任务中最后卷积层的感受野要大于输入图像。 感受野足够大时,被忽略的信息就较少。 目标检测任务中设置anchor要对齐感受野,anchor太大或者偏离感受野会对性能产生一定的影响。 增大感受野的方法:使用空洞卷积;使用池化层;增大卷积核。 阅读全文 → 2023-01-11
卷积有哪些主要的特点? 局部连接。比起全连接,局部连接会大大减少网络的参数。在二维图像中,局部像素的关联性很强,设计局部连接保证了卷积网络对图像局部特征的强响应能力。 权值共享。参数共享也能 阅读全文 → 2023-01-10
FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的 阅读全文 → 2023-01-10
One-stage目标检测与Two-stage目标检测的区别? Two-stage目标检测算法:先进行区域生成(region proposal,RP)(一个有可能包含待检物体的预选框),再通过卷积神经网络进行样本分类。其精度较高,速度较慢。 主要逻辑:特征提取—>生成RP—>分类/定位回归。 常见的Two-stage目标检测算法有:Faster R-CNN系列和R-FCN等。 One-stage目标检测算法:不用RP,直接在网络中提取特征来预测物体分类和位置。其速度较快,精度比起Two-stage算法稍低。 主要逻辑:特征提取—>分类 阅读全文 → 2023-01-10
BN层训练和测试的不同。 在训练阶段,BN层是对每一批的训练数据进行标准化,即用每一批数据的均值和方差。(每一批数据的方差和标准差不同); 而在测试阶段,我们一般只输入一个测试样本,并没有batch的概念。因此这个时候用的均值和方差是整个数据集训练后的均值和方差,可以通过滑动平均法 阅读全文 → 2023-01-10
CNN中池化的作用? 池化层的作用是对感受域内的特征进行选择,提取区域内最具代表性的特征,能够有效地减少输出特征数量,进而减少模型参数量。按操作类型通常分为最大池化(Max Pooling)、平均池化(Average Pooling)和求和池化(Sum Pooling),它们分别提取感受域内最大、平均与总和的特征值作为输出,最常用的是最大池化和平均池化。 阅读全文 → 2023-01-09