DL| Weakly Supervised Semantic Segmentation (WSSS) 최신 연구 동향 정리
WSSS는 픽셀 수준 어노테이션 없이 이미지 수준 레이블만으로 의미론적 분할을 수행하는 기법, 대표적인 접근법들을 간략하게 정리
KL-Divergence Loss 간단 설명 BoostCampAITECH
WSSS는 픽셀 수준 어노테이션 없이 이미지 수준 레이블만으로 의미론적 분할을 수행하는 기법, 대표적인 접근법들을 간략하게 정리
KL-Divergence Loss 간단 설명 BoostCampAITECH
HRNet의 필요성부터 구조, 세부 구현 방식
BoostCampAITECH
이전 포스트에 이어서 DeepLab v2의 ASPP, PSPNet의 Pyramid Pooling, DeepLab v3의 GAP 통합, DeepLab v3+의 Encoder-Decoder 구조 및 Xception 백본 수정까지 주요 모델들의 구조적 차이와 발전 과정을 비교하며 정리. Global Contextual Information 활용 방식 중심.
ASPP global contextual information BoostCampAITECH
FCN의 Receptive Field 문제를 해결하기 위한 기법으로 Dilated Convolution을 도입하고, 이를 기반으로 설계된 DeepLab v1과 DilatedNet의 구조와 특징, CRF 기반 후처리를 통한 정교한 예측 향상 방식
DeepLabv1 리뷰 DeepLab의 Atrous CNN DeepLab(2) Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials BoostCampAITECH
FCN의 구조적 한계를 보완하기 위해 Decoder를 강화한 DeconvNet, SegNet과 Skip Connection을 활용한 FC DenseNet, U-Net의 구조적 특성
DeconvNet 리뷰 여러 유형의 Convolution BoostCampAITECH
cGAN 개념과 구조를 설명하고 Pix2Pix와 CycleGAN을 통해 이미지-이미지 변환 모델이 어떻게 설계되었는지, GAN의 한계를 보완하는 Perceptual Loss 방식과 SRGAN 등 고해상도 이미지 생성 방법, 응용 사례에는 뭐가 있는지
BoostCampAITECH
Semantic Segmentation을 위한 FCN 모델의 핵심 구조와 개념을 상세히 분석. VGG 기반의 인코더 구조부터 FC Layer의 Conv화, Transposed Convolution, Skip Connection을 이용한 FCN-32s/16s/8s의 성능 개선 원리까지 코드와 함께 정리
FCN(Fully Convolution Network) FCN 논문 리뷰 — Fully Convolutional Networks for Semantic Segmentation FCN BoostCampAITECH
Transformer 기반 객체 검출의 시작점인 DETR의 구조와 학습 방식, 그리고 ViT의 한계를 극복하고 CNN 구조를 대체한 Swin Transformer의 핵심 메커니즘과 계층적 패치 처리 전략
DETR 논문 리뷰 Swin 논문 리뷰 BoostCampAITECH
시퀀스 데이터를 처리하는 대표적인 모델들 간략하게 정리, LSTM의 내부 게이트 매커니즘 포함
Understanding LSTM Networks BoostCampAITECH
ViT정리
Vision Transformer(1) 논문리뷰: An Image is Worth 16X16 Words: Transformers for Image Recognition at Scale BoostCampAITECH