Paper Review. DEFORMABLE DETR_DEFORMABLE TRANSFORMERS@ICLR’2021
Introduction
Deformable DETR
Experiments
Conclusions & Reviews
multi-scale feature map을 encoder input으로 사용하여 FPN의 효과를 도출함.
deformable attention을 통해 computation을 줄임으로써 학습시간을 대폭 단축시킴.
object detection에서 multi-scale의 중요성을 다시 한번 느낌.
DCN의 개념을 가져와 모든 key를 고려하지 않고 query에 인접한 key들만 attention을 계산하는 것이 신선함.
회전된 bbox를 예측하는 항공 이미지 task에도 적용해보면 좋을 거 같다는 생각을 함.
Reference
This post is licensed under CC BY 4.0 by the author.