
Project. Real Time Image2Cari

Real-time Image2Cari

  • CariGAN과 Style Transfer 모델을 활용하여 Real-time Style and Caricature Transfer가 가능한 모델 설계.


  • CariGAN에서 기본 제공하는 Caricatures 외 다양한 Caricatures을 수집.


  • Model은 크게 face detection, Caricature Retrieval, Shape Transformation, Style Transfer로 구분되어짐.
  • (1) MTCNN을 통해 User의 Face를 detection.
  • (2) Caricature Dataset을 가지고 Caricature Retrieval을 수행.
  • (3) (1)에서 detection한 영역을 통해 Face Parsing을 수행.
  • (4) (2)의 Retrieval 결과 Mask와 (3)의 결과 Mask를 통해 Shape을 맞춰주는 Shape Transformation Network를 통과.
  • (5) 사용자 얼굴에 Caricature된 shape을 가지는 (4)의 결과에 Style transfer를 수행.
  • (6) 최종적으로 Input img에 대해 Caricature shape을 가지고, Style img의 textual를 담고 있는 Output img 생성.

Shape Transformation

Style Transfer


  • Entire input
  • Only Face input


  • 웹캠을 통한 실시간 Shape Transformation을 수행할 때 카메라의 각도와 거리, 그리고 User(input)의 움직임으로 인해 완벽하게는 Caricature의 Shape이 나오지 않는 문제점이 발생.
  • 이로 인한 output Cari Shape Quality는 다소 떨어짐.
  • 실시간 움직임에 강건한 Shape Transformation 기법을 적용할 필요가 있음.
This post is licensed under CC BY 4.0 by the author.