ํด๋น ๋ธ๋ก๊ทธ๋ ๊ณต๋ถ๋ฅผ ๋ชฉ์ ์ผ๋ก https://kuklife.tistory.com/121 ๋ธ๋ก๊ทธ๋ฅผ ํ์ฌํ๋ฉฐ ์ด ๊ธ์ ๋๋ค.
paper Link: https://arxiv.org/pdf/1802.02611.pdf
###########################
DeepLab V3+ ๋ ผ๋ฌธ์ 2018๋ 8์ ๊ฒฝ ๊ตฌ๊ธ์์ ์์ฑ๋ ๋ ผ๋ฌธ์ ๋๋ค.
Semantic Segmentation์ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ๋ก ์ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์กด์ฌํ์ง๋ง ๊ทธ์ค DeepLab ์๋ฆฌ์ฆ๋ ์ฌ๋ฌ Segmentation model ์ค ์๋ฅ์ด ์์๊ถ์ ๋ง์ด ํฌ์ง๋์ด ์๋ model๋ค์ ๋๋ค.
๊ทธ์ค์์๋ ๊ฐ์ฅ ์ฑ๋ฅ์ด ๋์ผ๋ฉฐ DeepLab์๋ฆฌ์ฆ ์ค ๊ฐ์ฅ ์ต๊ทผ์ ๋์จ DeepLab V3+์ ๋ํด์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
์ ์ฒด์ ์ผ๋ก DeepLab์ semantic segmentation์ ์ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก atrous convolution์ ์ ๊ทน์ ์ผ๋ก ํ์ฉํ ๊ฒ์ ์ ์ํฉ๋๋ค. ์ ์ฒด์ ์ธ ํ๋ฆ์ ๋ณด๊ธฐ ์ํด ์๋์ ์๋ฆฌ์ฆ ๋ณ๋ก ์ด๋ค ๋ณํ๊ฐ ์์๋์ง ๊ฐ๋จํ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
- DeepLab V1: Atrous conolution์ ์ฒ์ ์ ์ฉํ์์ต๋๋ค.
- DeepLab V2: multi-scale context๋ฅผ ์ ์ฉํ๊ธฐ ์ํด Atrous Spatial Pyramid Pooling์ ์ ์ํฉ๋๋ค.
- DeepLab V3: ๊ธฐ์กด ResNet ๊ตฌ์กฐ์ Atrous Convolution์ ํ์ฉํ์ฌ ์ข ๋ Dense ํ Feature map์ ์ป๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
- DeepLab V3+: Depthwise Separable Convolution๊ณผ Atrous Convolution์ ๊ฒฐํฉํ Atrous Separable Convolution์ ํ์ฉ์ ์ ์ํฉ๋๋ค.
DeepLab V3+ ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๋ฉด ๊ด๋ จ ์ฐ๊ตฌ๋ก V1์์ ์ ์๋ atrous convolution, V2์์ ์ ์๋ ASPP, ๋ง์ง๋ง์ผ๋ก Depthwise Separable Convolution์ ๋ํด์ ์ธ๊ธํ๋ ์ด ๊ธ์์๋ ์ธ๊ธ ํ ๋ณธ๋ฌธ์ผ๋ก ๋ค์ด๊ฐ ๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
Relation Works
1) Atrous Convolution
Atrous์์ tous๋ ๊ตฌ๋ฉ(hole)์ ์๋ฏธํฉ๋๋ค. ๋ฐ๋ผ์ Atrous Convolution์ ๊ธฐ์กด Convolution๊ณผ ๋ค๋ฅด๊ฒ ํํฐ ๋ด๋ถ์ ๋น ๊ณต๊ฐ์ ๋ ์ฑ ์๋ํฉ๋๋ค.
์ ๊ทธ๋ฆผ์์๋ ์ผ๋ง๋ ๋น ๊ณต๊ฐ์ ๋์ง ๊ฒฐ์ ํ๋ ํ๋ผ๋ฏธํฐ๊ฐ r์ด 1์ธ ๊ฒฝ์ฐ, ๊ธฐ์กด์ Convolution๊ณผ ๋์ผํ๊ณ r์ด ์ปค์ง์๋ก ๋น ๊ณต๊ฐ์ด ๋์ด์ง๊ฒ ๋ฉ๋๋ค.
์ด๋ฌํ Atrous Convolution์ ํ์ฉํจ์ผ๋ก์จ ์ป์ ์ ์๋ ์ด์ ์ ๊ธฐ์กด convolution๊ณผ ๋์ผํ ์์ ํ๋ผ๋ฏธํฐ์ ๊ณ์ฐ๋์ ์ ์งํ๋ฉด์๋, Field of View(ํ ํฝ์ ์ด ๋ณผ ์ ์๋ ์์ญ)์ ํฌ๊ฒ ๊ฐ์ ธ๊ฐ ์ ์๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค.
์ฆ, ์ฌ๋ฌ convolution๊ณผ pooling ๊ณผ์ ์์ ๋ํ ์ผํ ์ ๋ณด๊ฐ ์ค์ด๋ค๊ณ ํน์ ์ด ์ ์ ์ถ์ํ๋๋ ๊ฒ์ ์ด๋์ ๋ ๋ฐฉ์งํ ์ ์๊ธฐ ๋๋ฌธ์, DeepLab series์์๋ ์ด๋ฅผ ์ ๊ทน์ ์ผ๋ก ํ์ฉํ๋ ค ๋ ธ๋ ฅํฉ๋๋ค.
(Field of View์ ๋ํ ์ถ๊ฐ์ค๋ช )
๋ณดํต Semantic Segmentation์์ ๋์ ์ฑ๋ฅ์ ๋ด๊ธฐ ์ํด์๋ CNN์ ๋ง์ง๋ง์ ์กด์ฌํ๋ ํ ํฝ์ ์ด ์ ๋ ฅ๊ฐ์์ ์ด๋ ํฌ๊ธฐ์ ์์ญ๊น์ง ์ปค๋ฒํ ์ ์๋์ง๋ฅผ ๊ฒฐ์ ํ๋ Receptive Field์ ํฌ๊ธฐ๊ฐ ์ค์ํ๊ฒ ์์ฉํฉ๋๋ค.
31*31 Large Kernel ๋ ผ๋ฌธ ์ฐธ์กฐ: https://openaccess.thecvf.com/content/CVPR2022/papers/Ding_Scaling_Up_Your_Kernels_to_31x31_Revisiting_Large_Kernel_Design_CVPR_2022_paper.pdf
2) Atrous Spatial Pyramid Pooling (ASPP)
Semantic Segmentation์ ์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํ ๋ฐฉ๋ฒ ์ค ํ๋๋ก, spatial pyramid pooling ๊ธฐ๋ฒ์ด ์์ฃผ ํ์ฉ๋๊ณ ์๋ ์ถ์ธ์ ๋๋ค.
DeepLab V2์์ feature map์ผ๋ก๋ถํฐ rate๊ฐ ๋ค๋ฅธ Atrous Convolution์ ๋ณ๋ ฌ๋ก ์ ์ฉํ ๋ค, ์ด๋ฅผ ๋ค์ ํฉ์ณ์ฃผ๋ ASPP๊ธฐ๋ฒ์ ํ์ฉํ ๊ฒ์ ์ ์ํ์์ต๋๋ค. ์ต๊ทผ ๋ฐํ๋ PSPNet์์๋ Atrous Convolution์ ํ์ฉํ์ง ์์์ง๋ง, ์ด์ ๋น์ทํ Pyramid Pooling ๊ธฐ๋ฒ์ ํ์ฉํ์์ต๋๋ค.
์ด๋ฌํ ๋ฐฉ๋ฒ๋ค์ multi-scale context๋ฅผ ๋ชจ๋ธ ๊ตฌ์กฐ๋ก ๊ตฌํํ์ฌ ๋ณด๋ค ์ ํํ Semantic Segmentation์ ์ํํ ์ ์๋๋ก ๋์ฐ๋ฉฐ, DeepLab V3๋ถํฐ๋ ASPP๋ฅผ ๊ธฐ๋ณธ ๋ชจ๋๋ก ๊ณ์ ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
3) Depthwise Separable Convoltion
์์ ๊ทธ๋ฆผ์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ Convolution์ ๋ํ๋ธ ์ฌ์ง์ ๋๋ค.
์ ๋ ฅ ์ด๋ฏธ์ง๊ฐ 8*8*3(H*W*C)์ด๊ณ , Convolution ํํฐ ํฌ๊ธฐ๊ฐ 3*3(F*F)์ด๋ผ๊ณ ํ ๋, ํํฐ ํ๊ฐ๊ฐ ๊ฐ์ง๋ ํ๋ผ๋ฏธํฐ ๊ฐ์๋ 3*3*3(F*F*C)๊ฐ ๋ฉ๋๋ค. ๋ง์ฝ ํํฐ๊ฐ 4๊ฐ๋ผ๋ฉด, ํด๋น Convolution์ ์ด ํ๋ผ๋ฏธํฐ ์๋ 3*3*3*4(F*F*C*N)๋งํผ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค.
Convolution ์ฐ์ฐ์์ Channel ์ถ์ ํํฐ๊ฐ ํ๋ฒ์ ์ฐ์ฐํ๋ ๋์ ์ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ์ ๋ ฅ ์์์ Channel ์ถ์ ๋ชจ๋ ๋ถ๋ฆฌ์ํจ ๋ค, Channel ์ถ ๊ธธ์ด๋ฅผ ํญ์ 1๋ก ๊ฐ์ง๋ ์ฌ๋ฌ ๊ฐ์ Convolution ํํฐ๋ก ๋์ฒด์ํจ ์ฐ์ฐ์ Depthwise Separable Convolution์ด๋ผ๊ณ ํฉ๋๋ค.
์ด์ฒ๋ผ ๋ณต์กํ ์ฐ์ฐ์ ์ํํ๋ ์ด์ ๋ ๊ธฐ์กด Convolution๊ณผ ์ ์ฌํ ์ฑ๋ฅ์ ๋ณด์ด๋ฉด์๋ ์ฌ์ฉํ๋ ํ๋ผ๋ฏธํฐ์์ ์ฐ์ฐ๋์ ํ๊ธฐ์ ์ผ๋ก ์ค์ผ ์ ์๊ธฐ ๋๋ฌธ์ ๋๋ค.
์๋ฅผ ๋ค์ด ์ ๋ ฅ๊ฐ์ด 8*8*3์ด๊ณ 16๊ฐ์ Convolutionํํฐ๋ฅผ ์ ์ฉํ ๋ ์ฌ์ฉ๋๋ ํ๋ผ๋ฏธํฐ ๊ฐ์๋
- Convolution: 3*3*3*16 = 432
- Depthwise Separable Convolution: 3*3*3 + 3*16 = 27 + 48 = 75
์์ ํ์ธํ ์ ์์ต๋๋ค.
Depthwise Convolution์ ํ ๊ฐ์ ํํฐ๊ฐ ํ ๊ฐ์ ์ฑ๋์๋ง ์ฐ์ฐ์ ์ํํ๋ค๊ณ ์ดํดํ๋ฉด ์ข ๋ ์ดํด๊ฐ ์์ํฉ๋๋ค.
Depthwise Seprable Convolution์ ๊ธฐ์กด Convolution Filter๊ฐ Spatial Dimension๊ณผ Channel Dimension์ ๋์์ ์ฒ๋ฆฌํ๋ ๊ฒ์ ๋ฐ๋ก ๋ถ๋ฆฌ์์ผ ๊ฐ๊ฐ ์ฒ๋ฆฌํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
๋ ์ถ์ ๋ถ๋ฆฌ์์ผ ์ํํ๋๋ผ๋ ์ต์ข ๊ฒฐ๊ณผ๊ฐ์ ๊ฒฐ๊ตญ ๋ ๊ฐ์ง ์ถ ๋ชจ๋๋ฅผ ์ฒ๋ฆฌํ ๊ฒฐ๊ด๊ฐ์ ์ป์ ์ ์์ผ๋ฏ๋ก, ๊ธฐ์กด Convolution Filter๊ฐ ์ํํ๋ ์ญํ ์ ์ถฉ๋ถํ ๋์ฒดํ ์ ์๊ฒ ๋์์ต๋๋ค.
Dephwise Convolution: https://gaussian37.github.io/dl-concept-dwsconv/
Depthwise separable convolution ์ฐ์ฐ
gaussian37's blog
gaussian37.github.io
ํด๋น ๋ธ๋ก๊ทธ์ ์์ธํ ์ค๋ช ์ด ๋์ด์์ด, ๋งํฌ๋ฅผ ์ฒจ๋ถํฉ๋๋ค.
4) Encoder-Decoder
๋ง์ง๋ง์ผ๋ก DeepLab V3+์์๋ ์์์ ์ค๋ช ํ ๋ชจ๋๋ค์ Encoder-Decoder์ ํํ๋ก ๊ตฌ์กฐํ์์ผฐ์ต๋๋ค.
U-Net๊ณผ ์ ์ฌํ๊ฒ intermediate connection์ ๊ฐ์ง๋ encoder-decoder ๊ตฌ์กฐ๋ฅผ ์ ์ฉํ์ฌ ๋ณด๋ค spatial ํ ํน์ง์ ์ด๋ ค object boundary๋ฅผ ์์ธก ๊ฐ๋ฅํ๋๋ก ํ์์ต๋๋ค.
Method
DeepLab V3+ ์์๋ Encoder๋ก DeepLab V3๋ฅผ ์ฌ์ฉํ๊ณ , Decoder๋ก Bilinear Upsampling๋์ U-net๊ณผ ์ ์ฌํ๊ฒ Concatํด์ฃผ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
DeepLab V3์ DeepLab V3+์ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ๋จผ์ ๊ฐ๋จํ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
DeepLab V3๋ ๊ธฐ๋ณธ์ ์ผ๋ก ResNet์ BackBone์ผ๋ก ์ฌ์ฉํ์์ผ๋ฉฐ ๊ตฌ์กฐ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- Encoder: Autrous Convolution๋ฅผ ์ ์ฉํ ResNet
- ASPP
- Decoder: Bilinear Upsampling
DeepLab V3+์ ๊ตฌ์กฐ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- Encoder: ResNet with Atrous Convolution์ Xception์ผ๋ก ๋ณ๊ฒฝ
- ASP๋ฅผ ASSPP (Atrous Separable Spatial Pyramid Pooling)์ผ๋ก ๋ณ๊ฒฝ
- Decoder: Bilinear Upsampling์ Simplified U-Net style decoder๋ก ๋ณ๊ฒฝ
์์ ๋ด์ฉ์ ์ข ๋ ์ธ๋ถ์ ์ผ๋ก ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1) Encoder-Decoder with Atrous Coovolution
- Encoder
DCNN์์ Atrous Convolution์ ํตํด ์์์ resolution์ผ๋ก feature map์ ๋ฝ์๋ผ ์ ์๋๋ก ํฉ๋๋ค.
์ฌ๊ธฐ์ Output Stride์ ๊ฐ๋ ์ด ์ฌ์ฉ๋ฉ๋๋ค. "input image์ resolution๊ณผ ์ต์ข output์ ๋น"๋ก ์๊ฐํ๋ฉด ๋ฉ๋๋ค. ์ฆ, ์ต์ข feature map์ด input image์ ๋นํด 32๋ฐฐ ์ค์ด๋ค์๋ค๋ฉด, output stride๋ฅผ 32๋ก ์ค์ ํ๋ ๊ฒ์ผ๋ก ์ดํดํ๋ฉด ๋ฉ๋๋ค.
Semantic Segmentation์์๋ ๋์ฑ ๋ํ ์ผํ ์ ๋ณด๋ฅผ ์ป์ด๋ด๊ธฐ ์ํด ๋ง์ง๋ง ๋ถ๋ถ์ Block์ 1๊ฐ ํน์ 2๊ฐ๋ฅผ ์ญ์ ํ Atrous Convolution ํด์ค์ผ๋ก์จ Output Stride๋ฅผ 16 ํน์ 8๋ก ์ค์ ๋๋ค.
๊ทธ๋ฆฌ๊ณ ์๋ ์ฌ์ง๊ณผ ๊ฐ์ด ๋ค์ํ ํฌ๊ธฐ์ ๋ฌผ์ฒด ์ ๋ณด๋ฅผ ์ก์๋ด๊ธฐ ์ํด ๋ค์ํ rate์ Atrous Convolution์ ์ฌ์ฉํ๋ ASPP(Atrous Spatial Pyramid Pooling)์ ์ฌ์ฉํฉ๋๋ค.
- Decoder
์ด์ ์ DeepLab V3์์๋ Decoder ๋ถ๋ถ์ ๋จ์ํ bilinear upsampling ํด์ฃผ์์ง๋ง, V3+์์๋ Encoder์ ์ต์ข Output์ 1*1 Convolution์ ํ์ฌ Channel์ ์ค์ด๊ณ bilinear upsampling ํด์ค ํ Concat ํ๋ ๊ณผ์ ์ด ์ถ๊ฐ๋์์ต๋๋ค.
2) Modified Aligned Xception
๋ณธ๋ก ์ผ๋ก ๋ค์ด๊ฐ๊ธฐ ์ ์, Xception์ Inception Module์ Depthwise Separable Convolution์ ์ ์ฉํ ๊ฒ์ ๋๋ค.
(Xception์ ๋ํ ์ถ๊ฐ ์ค๋ช )
ํด๋น ๋ ผ๋ฌธ์๋ inception Module์ด ๋ฌด์์ธ์ง ์น์ ํ๊ฒ ์ค๋ช ํด์ฃผ์ง ์์๊ธฐ ๋๋ฌธ์, Inception Module์ด ๋ฌด์์ธ์ง๋ถํฐ ์ดํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๋ณดํต Convolution ์ฐ์ฐ์ ํตํด W, H์ ํฌ๊ธฐ๋ฅผ ์ค์ด๊ณ C๋ ๋๋ฆฌ๋ ํํ๋ฅผ ์ทจํ๊ฒ ๋๋๋ฐ, Inception์ ์์ ๊ตฌ์กฐ๋ฅผ ํตํด ์ฐจ์์ ์ค์ด๋ ํจ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค.
- W, H๋ Max-Pooling์ ํตํด์ ์ค์ ๋๋ค.
- C๋ Convolution Filter์์ ์ง์ ์ด ๊ฐ๋ฅํฉ๋๋ค. (๋ณดํต์ Convolution์ C๋ฅผ ๋๋ ค ๋ชจ๋ธ์ Width๋ฅผ ์กฐ์ ํ๋ ๋ฐฉํฅ์ผ๋ก ์งํ๋ฉ๋๋ค.)
- ์ด ๋, 1*1 ์ฐ์ฐ์ Convolution ์ฐ์ฐ์ ์ฌ์ฉ๋๋ ํํฐ๋ฅผ 1*1๋ก ํ๊ณ C๋ ๋๋ฆฌ๋ ๊ฒ์ด ์๋๋ผ, ํฌ๊ธฐ๋ฅผ ์ค์ด๋ ์ญํ ์ ์ํํ๋๋ก ํฉ๋๋ค.
์ด๋ฌํ 1x1 convolution ์ฐ์ฐ์ Fully Connected Layer (FCL)๊ณผ ๋น์ทํ ๋ฐฉ์์ผ๋ก ์๋ํ๋ฏ๋ก, ์ด๋ฅผ Network in Network (NIN)๋ผ๊ณ ๋ถ๋ฅด๊ธฐ๋ ํฉ๋๋ค. 1x1 convolution์ด ์งํ๋๋ฉด์ ๊ฐ ์ฑ๋์ ์ ๋ณด๋ฅผ ์ํธ ์ฐ๊ด์ํค๋ ๊ฒ์ด FCL์ด ํ๋ ์ผ๊ณผ ๋น์ทํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ค๋ง, 1x1 convolution์ FCL์ ๋นํด ๊ณต๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ๋ ์ ์ ์งํ๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
๋ค์ DeepLab V3+๋ก ๋์์์, DeepLab V3+์์๋ Xception์ Backbone์ผ๋ก ์ฌ์ฉํ์ง๋ง MSRA์ Aligned Xception๊ณผ ๋ค๋ฅธ 3๊ฐ์ง ๋ณํ๋ฅผ ์ฃผ์์ต๋๋ค.
์๋์ ๋ชจ๋ธ๊ณผ ๋ค๋ฅธ ๋ ผ๋ฌธ์์ ์ฌ์ฉ๋ ๋ณํ Xception model์ ํน์ง์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- ๋น ๋ฅธ ์ฐ์ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ ์ํด Entry Flow Structure๋ฅผ ์์ ํ์ง ์์์ต๋๋ค.
- Atrous Separable Convolution์ ์ ์ฉํ๊ธฐ ์ํด ๋ชจ๋ Pooling Layer๋ฅผ Depthwise Separable Convolution์ผ๋ก ๋์ฒดํ์์ต๋๋ค. ๊ฐ๊ฐ์ 3*3 Depthwise Convolution ์ดํ์ ์ถ๊ฐ์ ์ผ๋ก Batch-Norm๊ณผ ReLU ํ์ฑํ ํจ์๋ฅผ ์ถ๊ฐํด ์ฃผ์์ต๋๋ค.
(3) Experiment
๋ค์ํ ํ๋ผ๋ฏธํฐ์ ์ธํ ์ ๋ํด ์คํ์ ์งํํ๋๋ฐ, ์ฐ์ ResNet-101 ๊ตฌ์กฐ๋ฅผ Encoder๋ก ์ฌ์ฉํ์์ ๋, ์ฑ๋ฅ์ ์ธก์ ํ ๊ฒ์ ๋๋ค.
Decoder ๋ถ๋ถ์ Bilinear upsampling ํ๋ ๋์ , ๋จ์ํ๋ U-net๊ตฌ์กฐ๋ก ๋ณ๊ฒฝํ ๊ฒฝ์ฐ ๊ธฐ์กด ๋๋น mIoU๊ฐ 1.64% ํฅ์๋ ๋ชจ์ต์ ๋ณผ ์ ์์ต๋๋ค.
Qualitative effect of employing the proposed decoder module compared with the naive bilinear upsampling (denoted as BU). In the examples, we adopt Xception as feature extractor and train output stride = eval output stride = 16.
์ดํ, Encoder๋ฅผ Xception์ผ๋ก ๊ต์ฒด ํ ์คํํ์ ๋๋ ์ฝ 2%๊ฐ๋์ ์ฑ๋ฅ ํฅ์์ ๊ฐ์ ธ์์ต๋๋ค.
ASPP ๋ถ๋ถ๊ณผ Decoder๋ถ๋ถ์ ์ฌ์ฉ๋๋ Convolution๋ค์ ๋ชจ๋ Separable Convolution์ผ๋ก ๋์ฒดํ ๊ฒฝ์ฐ ์ฑ๋ฅ์ ๊ธฐ์กด Convolution์ ์ฌ์ฉํ ๋์ ๊ฑฐ์ ๋น์ทํ์์ง๋ง, ๋ชจ๋ธ์ด ์ฌ์ฉํ๋ ์ฐ์ฐ๋ ์์ฒด๊ฐ ํ๊ธฐ์ ์ผ๋ก ์ค์ด๋ค์์์ ํ์ธํ ์ ์์์ต๋๋ค.
'๐ฅ๏ธ Computer Vision > ๐ฐ Paper' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Focal Loss (0) | 2023.08.24 |
---|---|
[๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Barlow Twins (Self-Supervised Learning via Redundancy Reduction) (0) | 2023.08.16 |
[๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Keypoint-wise Adaptive Loss for Whole Body Human Pose Estimation (0) | 2023.05.29 |