快速了解一个网络：DETR, End-to-End Object Detection with Transformers

发表于 2025/04/21 更新于 2025/05/29

作者 Yinghao Sun

1 分钟阅读

以下内容偏向于记录个人学习过程及思考，请审慎阅读。

背景

现有目标检测器通常是通过“边界框”回归和“分类”预测两个任务组合完成，且需要后处理操作（NMS）进行重复框的去除。

本文将目标检测任务看作“直接集合预测”任务，通过二分图匹配的算法进行预测框和GT框的关联，基于transformer的encoder-decoder架构进行任务学习。

其中，N个object queries是网络可学习的参数。

无

本文由作者按照 CC BY 4.0 进行授权