快速了解一个网络:SPP-net, Spatial Pyramid Pooling net
以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 RCNN算法,在CNN输入部分需要固定的图像大小(如224x224)。这就需要对所有不同大小的region proposals进行crop(切割)或者wrap(变形)来满足CNN部分的输入要求,而这会导致看不到检测目标全貌或使得待检测目标变形。另外,RCNN对于一张图像的推理时间会相对比较长。 为什么CNN输入部分需要固定的图...
以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 RCNN算法,在CNN输入部分需要固定的图像大小(如224x224)。这就需要对所有不同大小的region proposals进行crop(切割)或者wrap(变形)来满足CNN部分的输入要求,而这会导致看不到检测目标全貌或使得待检测目标变形。另外,RCNN对于一张图像的推理时间会相对比较长。 为什么CNN输入部分需要固定的图...
以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 在RCNN提出之前,目标检测一般是基于传统的特征提取方法做的(如HOG等),一个典型的pipeline是 输入一张图片 从图片中提取出一些局部区域,作为待检测区(又名Region Proposals,可使用滑窗、Selective Search等) 基于传统的特征提取方法提取这些待检测区的特征(通常是经过复杂设计...