-
ERFNet: Efficient Residual Factorized ConvNetfor Real-Time Semantic Segmentation공부기록/논문리뷰 2022. 9. 29. 14:27
Title
Redidual : ResNet 같이 Residual connection이 있으려나
Abstract
Semantic segmentation의 현재 sota는 quality와 computational resource에서 trade-off가 그렇게 괜찮지 않음.
그래서 실제 vehicle같은데서 활용하기 어려움.이 논문에선 real time에 가능한 semantic segmentation을 제안함. 우리 구조의 핵심은 redisual connection과 factorized convolution을 사용하는 레이어임.
Figures
전체적인 구조. encoder-decoder 구조로 이루어져있다.
b는 원래 있었던 bottleneck 구조, c가 이 논문이 제안하는 non-bottleneck-1d 구조이다.
error 차이Introduction
sota모델에서 quality와 resource의 trade-off간에 적당한 모델은 없음. efficient에 집중한 연구는, parameter를 급격하게 줄이는 방법등으로 인해 정확도가 심하게 떨어진다.
우리가 제안하는 ERFNet은 real-time sementic segmentation이고, 핵심은 skip connection을 통한 residual학습과, cost를 줄이기 위한 1D factorized convolution의 활용이다.
Conclusion
About Model
A. Factorized residual Layers
Residual layer의 original work(ResNet)은 residual layer로 2개를 제안했는데, 하나는 non-bottleneck의 3x3 conv 2개고, 다른 하나는 fig2. 에 설명된 bottleneck 모델이다.
둘다 파라미터랑 정확도가 비슷하지만, bottleneck쪽이 computation resource를 적게 차지한다.
그렇기 때문에 최근 sota 모델들은 대부분 bottleneck을 채용하고 있다.
그러나 non-bottleneck ResNet이 깊이가 깊어지면 성능이 더 좋다고 한다.2D convolution layer 대신에 1D filter 2개를 none-linearity를 끼워 넣을 수 있음을 발견했다.
이를 하면 파라미터가 33%정도 줄어든다Self Questions
What did authors try to accomplish?
Key elements of the approach?
What can you use yourself?
Other references want to follow?
Questions
Related Papers
'공부기록 > 논문리뷰' 카테고리의 다른 글
Segmenting Transparent Objects in the Wild 리뷰 (0) 2022.09.29 Pyramid Scene Parsing Network 리뷰 (0) 2022.09.28 Efficient RGB-D Semantic Segmentation for Indoor Scene Analysis 리뷰 (0) 2022.09.26 Self6D: Self-Supervised Monocular 6D Object Pose Estimation 리뷰 (0) 2022.09.26 Interactive Robotic Grasping with Attribute-Guided Disambiguation 리뷰 (0) 2022.09.26