百度飞桨顶会论文复现营DETR解读笔记目标检测两个关键子任务:目标分类和目标定位。DETR模型是将目标检测视为集合预测(setprediction)的方式,将训练和预测做到真正的端对端,不需要NMS的后处理,也不需要人为设置anchor。核心是1.set-based的全局Loss,使用二分图匹配生成唯一的预测;2.基于encoder-decoder的transformer。CNN代表图像特征编码的backbone,transformer后面的输出是最终预测的结果集合,transformer会对集