Paper Review. General Multi-label Image Classification with Transformers@CVPR’ 2021
Abstract
Introduction
Multi-label Classification
Model
Experiments
Conclusions & Reviews
multi-label task에서 transformer 구조를 사용하여 이미지와 레이블, 레이블 간의 관계를 파악함.
처음으로 추가적인 정보(partial, extra) label을 사용해 당시에 SOTA 달성.
실제 상황(SNS의 해시태그 등)에서 일반적으로 얻을 수 있는 위치나 날씨 같은 meta 데이터를 실용적으로 사용할 수 있음.
multi-label classification을 처음으로 자세히 본 시간이었고, CV에서 transformer의 심상치 않은 기류를 다시 한번 느낄 수 있는 시간이었다.
Reference
This post is licensed under CC BY 4.0 by the author.