快速了解一个网络：BIRA Net, Radar+RGB Attentive Fusion For Robust Object Detection In Autonomous Vehicles

发表于 2025/01/27 更新于 2025/04/16

作者 Yinghao Sun

2 分钟阅读

以下内容偏向于记录个人学习过程及思考，请审慎阅读。

背景

融合radar and camera以获得更鲁棒的目标检测网络。

将radar点云经过内外参反投到camera view上，通过resnet提features，接着通过maxpooling下采样后经过一个scSE Block（attention），再融合到camera image对应的FPN中。

因为种种原因，不一定所有的目标都有对应的radar点，因此基于radar产生的anchor boxes很可能是不全的。这里作者提了一种融合anchor boxes的方法，简单来说就是同时基于camera image和radar产生anchor，如果radar对应的anchor box与gt的iou更大，则覆盖掉iou较小的基于image的anchor
作者使用nuScenes数据集，采用3d转2d方式获得2d框真值。由于很多遮挡严重的框也会被放出，这里作者通过nuScenes提供的visibility level进行了过滤，设置为2
本文的基础网络是Faster RCNN + FPN，预训练权重基于COCO数据集。

无

本文由作者按照 CC BY 4.0 进行授权