본문 바로가기

논문 리뷰33

[RCAN] Image Super-Resolution Using Very Deep Residual Channel Attention Networks 논문 요약 CNN의 depth는 image super-resolution에서 중요한 요소이다. 하지만 깊은 네트워크일수록 훈련이 어렵다. 저해상도 입력과 features는 풍부한 low-frequency 정보를 가지고 있으며 채널별로 동일하게 다뤄진다. 하지만 이는 CNN의 표현 능력을 방해한다. 이를 해결하기 위해 very deep residual channel attention networks (RCAN)이 제시되었다. Residual in residual (RIR) 구조를 통해 깊은 네트워크를 만들 수 있으며 저해상도 정보가 여러 skip connections들을 통해 지나갈 수 있게 해 메인 네트워크가 고주파 요소들에 집중할 수 있게 한다. 추가로 channel attention을 사용하여 적응형.. 2022. 8. 9.
[DRLN] Densely Residual Laplacian Super-Resolution 논문 요약 이전 SISR 알고리즘들은 깊은 네트워크 구조와 오랜 훈련시간이 필요했다. 더불어 SR을 위한 CNN은 multople scales에서의 feature를 이용하지 못했으며 같은 weight를 가지게 하였다. Densely Residual Laplacian Network (DRLN)는 residual 구조에서 cascading residual을 사용하여 low-frequency flow가 high, mid-level features의 기능을 학습하는 데 집중할 수 있도록 한다. 더불어 denslely concatenated redisual blocks는 high-level complex features를 학습하는데 도움을 준다. 또한, feature map 사이의 inter and intra-l.. 2022. 8. 9.
[TOFlow] Video Enhancement with Task-Oriented Flow 논문 요약 많은 video enhancement 알고리즘은 비디오 시퀀스에 프레임을 register하기 위해 optical flow에 의존한다. 하지만 정확한 flow를 예측하는 것은 어렵고 어떤 경우 optical-flow자체가 특정 비디오 처리 문제에 sub-optimal한 경우도 있다. 이 논문에서는 하고자 하는 task에 맞는 motion representation을 self-supervised한 방법으로 학습할 수 있는 task-oriented flow (TOFlow)를 제시한다. 네트워크는 각 task에 맞는 flow를 학습할 수 있으며 motion estimation component와 video processing component로 구성되어있다. 더불어 평가를 위해 low-level 비디.. 2022. 7. 18.
[LPTN] High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network 논문 요약 1. Paper Bibliography 논문 제목 High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network 저자 Liang et al. 출판 정보 / 학술대회 발표 정보 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021. 2. Problems & Motivations Image to Image Translation (이하 I2IT)는 이미지를 source domain에서 target domain으로 변화를 주는 것이다. ex) day -> night, summer.. 2022. 7. 14.
[RTA] Revisiting Temporal Alignment for Video Restoration 1. Paper Bibliography 논문 제목 - Revisiting Temporal Alignment for Video Restoration 저자 - Zhou et al. 출판 정보 / 학술대회 발표 정보 - Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022. 년도 - 2022 2. Problems & Motivations Existing alignment methods Video restoration tasks에서 Long-range temporal alignment는 중요하지만 어려운 문제이다. 최근 long-range alignment를 여러 sub-alignment로 나누어 처리하여 점.. 2022. 7. 11.
[EFENet] EFENet: Reference-Based Video Super-Resolution with Enhanced Flow Estimation 1. Paper Bibliography 논문 제목 - EFENet: Reference-Based Video Super-Resolution with Enhanced Flow Estimation 저자 - Zhao et al. 출판 정보 / 학술대회 발표 정보 - CAAI International Conference on Artificial Intelligence. Springer, Cham, 2021. 년도 - 2021 2. Problems & Motivations Reference-based Video Super Resolution (RefVSR) "Reference-based Super-Resolution aims to recover high-resolution images by utilizing ext.. 2022. 6. 24.