1. Introduction

์ด ๋
ผ๋ฌธ์ long-tailed distribution(๊ธด ๊ผฌ๋ฆฌ ๋ถํฌ)์ ๊ฐ๋ ๋ฐ์ดํฐ์
์์ deep neural network๊ฐ ์ฑ๋ฅ ์ ํ๋ฅผ ๊ฒช๋ ๋ฌธ์ ์ ์ฃผ๋ชฉํฉ๋๋ค.
ํนํ, ํด๋์ค ๋ถ๊ท ํ ์ํฉ์์ ํํ ์ฌ์ฉ๋๋ inverse class frequency re-weighting์ ํ๊ณ๋ฅผ ์ง์ ํ๋ฉฐ, ์๋ก์ด ์์ค ํจ์์ธ Class-Balanced Loss๋ฅผ ์ ์ํฉ๋๋ค.
ํต์ฌ ์์ด๋์ด๋ โ๋ง์ ๋ฐ์ดํฐ๊ฐ ๋ ๋ซ๋คโ๋ ์ง๊ด์ ๊ธฐ๋ฐํ๋, ๋ฐ์ดํฐ๊ฐ ์๋ก ์ค๋ณต๋๊ฑฐ๋ ์ ์ฌํ ์ ์๋ค๋ ์ ์ ๊ณ ๋ คํด, ์ค์ ๋ก ๋ชจ๋ธ ํ์ต์ ๊ธฐ์ฌํ๋ Effective Number of Samples(์ ํจ ์ํ ์)๋ฅผ ์ ์ํ๊ณ , ์ด์ ๊ธฐ๋ฐํ์ฌ ์์ค ํจ์๋ฅผ ์กฐ์ ํฉ๋๋ค.
2. ๊ด๋ จ ์ฐ๊ตฌ (Related Work)
๋ถ๊ท ํ ๋ฐ์ดํฐ์ ๋ํ ๊ธฐ์กด ์ ๊ทผ๋ฒ์ ํฌ๊ฒ ๋ ๊ฐ์ง๋ก ๋๋ฉ๋๋ค.
1. Re-sampling
- Over-sampling: ์์ ํด๋์ค ๋ฐ์ดํฐ๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ์ฌ์ฉ -> ์ค๋ฒํผํ
- Under-sampling: ๋ค์ ํด๋์ค ๋ฐ์ดํฐ๋ฅผ ์ผ๋ถ ์ ๊ฑฐ -> ์ค์ ์ํ ์์ค ๊ฐ๋ฅ์ฑ ์กด์ฌ
2. Cost-sensitive Re-Weighting
- ์์ค ํจ์์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌ
- ์ผ๋ฐ์ ์ผ๋ก inverse class frequency๋ฅผ ์ฌ์ฉ
- ์ต๊ทผ ์ฐ๊ตฌ์์๋ inverse sqrt(frequency)๋ฅผ ์ฌ์ฉํ์ฌ ์ํ
๊ทธ๋ฌ๋ ์ด๋ฐ ๋ฐฉ๋ฒ๋ค์ ํด๋์ค ๊ฐ ์ ๋ณด๋์ ์ค์ง์ ๊ธฐ์ฌ๋๋ฅผ ๋ฐ์ํ์ง ๋ชปํ๋ค๋ ํ๊ณ๊ฐ ์์ต๋๋ค.
3. ์ด๋ก ์ ํ๋ ์์ํฌ (Theoretical Framework)
1. ์์ด๋์ด์ ์ถ๋ฐ์ : Random Covering Problem
Class Balanced Loss์ ํต์ฌ ์์ด๋์ด๋ Random Covering Problem์์ ์ถ๋ฐํฉ๋๋ค. ์ด ๋ฌธ์ ๋ โ์ด๋ค ๊ณต๊ฐ์ ๋ฌด์์๋ก ์ ํ๋ ์์ ์์ญ๋ค๋ก ์ผ๋ง๋ ์ ๋ฎ์ ์ ์๋๊ฐ?โ๋ฅผ ๋ฌป๋ ๊ณ ์ ์ ์ธ ํ๋ฅ ๋ฌธ์ ์
๋๋ค.

2. ํด๋์ค์ Feature ๊ณต๊ฐ ์ ์
- ์ด๋ค ํด๋์ค์ feature space๋ฅผ S ๋ผ๊ณ ์ ์ํฉ๋๋ค.
- ์ด ๊ณต๊ฐ์ ์ ์ฒด ๋ถํผ(Volume)๋ N >= 1์
๋๋ค.
-> ์ง๊ด์ ์ผ๋ก ๋ณด๋ฉด, ํด๋์ค์ ๋ด๋ถ ๋ค์์ฑ ๋๋ ํํ์ ๋ค์์ฑ ์ ๋๋ฅผ ๋ํ๋
๋๋ค.
3. ๊ฐ ์ํ์ ์๋ฏธ์ ์ค๋ณต ๊ฐ์
- ๊ฐ ์ํ์ ๋ถํผ(Volume) = 1 ์ธ ์์ ์์ญ์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค.
- ์ํ ๊ฐ ์ค๋ณต(overlap)์ด ๊ฐ๋ฅํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
-> ์ด ์ค๋ณต์ ๊ณง ์ ๋ณด์ ์ค๋ณต์ฑ์ ์๋ฏธํ๋ฉฐ, ์ค์ ๋ฐ์ดํฐ๊ฐ ๋น์ทํ ์ํฉ์ ๋ฐ์ํฉ๋๋ค.

4. ์๋ก์ด ์ํ์ ์ค๋ณต ํ๋ฅ
- (n - 1) ๊ฐ์ ์ํ์ ์ด๋ฏธ ๋ฝ์ ์ํ์์, ์๋ก์ด ์ํ์ด ๊ธฐ์กด๊ณผ ์์ ํ ๊ฒน์น ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
p = E_(n-1)/N
- ์ฌ๊ธฐ์ E_(n-1)์ n๋ฒ์งธ ์ํ์ ๋ฝ๊ธฐ ์ด์ ๊น์ง์ ์ ํจ ์ํ ์(Effective Number)์
๋๋ค.
+ ๋ถ๋ถ์ ์ผ๋ก ๊ฒน์น๋ ์ํฉ์ ๋ชจ๋ธ ๋จ์ํ๋ฅผ ์ํด ๋ฌด์ํฉ๋๋ค.
์ฆ, ์ํ์ ์์ ํ ๊ฒน์น๊ฑฐ๋, ์์ ํ ๊ฒน์น์ง ์์ ๋ ๊ฐ์ง ๊ฒฝ์ฐ๋ก๋ง ๋ด
๋๋ค.
2. Effective Number of Samples ๊ท๋ฉ์ ๋์ถ

4. Class-Balanced Loss

+ ์ ์ฉ ์์
4.0.1. Softmax Cross-Entropy Loss

4.0.2. Sigmoid Cross-Entropy Loss

4.0.3. - Focal Loss

5. ์คํ (Experiments)
1. Dataset
- Long-tailed CIFAR-10/100: ฮผ๋ฅผ ์กฐ์ ํ์ฌ ๋ถ๊ท ํ ์์ค ์ค์
- iNaturalist 2017/2018: ์ค์ long-tailed ๋ถํฌ
- imageNet(ILSVRC 2012)
2. ์ฃผ์ ๊ฒฐ๊ณผ
- CB Loss๋ ๊ธฐ์กด loss ๋๋น ์ผ๊ด๋ ์ฑ๋ฅ ํฅ์ ์ ๊ณต
- CIFAR-10: ํฐ beta์์ ์ฑ๋ฅ์ด ์ข์ -> coarse-grained class
-> ํด๋์ค ๊ฐ ๊ฒน์น๋ ์์ญ์ด ์ ๊ณ (๋ด๋ถ์ ๋ค์์ฑ์ด ํผ) ์ปค๋ค๋ ์ ๋ณด๊ณต๊ฐ(N)์ ๊ฐ์ง๊ณ ์๋ค๋ ์๋ฏธ๋ก ํด์ ๊ฐ๋ฅ
- CIFAR-100: ์์ beta๊ฐ ์ ๋ฆฌ -> fine-grained class
-> ํด๋์ค ๊ฐ ๊ฒน์น๋ ์์ญ์ด ๋ง๊ณ (๋ด๋ถ์ ๋ค์์ฑ์ด ์ ์) ์์ ์ ๋ณด๊ณต๊ฐ(N)์ ๊ฐ์ง๊ณ ์๋ค๋ ์๋ฏธ๋ก ํด์ ๊ฐ๋ฅ
6. ๊ฒฐ๋ก (Conclusion)
- Effective Number of Samples๋ผ๋ ๊ฐ๋
๋์
์ ํตํด ํด๋์ค๋ณ ๋ฐ์ดํฐ ์ ํจ ์ํ๊ณผ ์ ๋ณด๋์ ์ ๋ํ
- ์์ค ํจ์์ ํด๋์ค๋ณ๋ก ์ ํจ ์ํ ์๋ฅผ ๋ฐ์ํ ๊ฐ์ค์น๋ฅผ ์ ์ฉํจ์ผ๋ก์จ ๋ถ๊ท ํ ๋ฐ์ดํฐ์์๋ ๊ฐ๊ฑดํ ํ์ต ๊ฐ๋ฅ
- ํน์ ๋ชจ๋ธ์ด๋ ์์ค ํจ์์ ์ข
์๋์ง ์์ผ๋ฉฐ ๋ค์ํ ์ํฉ์ ์ ์ฉ ๊ฐ๋ฅ
-> Loss ๋ด๋ถ์ ๋ค์ด๊ฐ๋ ๋ณ์๋ก ๊ตฌ์ฑ๋์ง ์์๊ณ , ์์๋ก ๋ค์ด๊ฐ๊ธฐ ๋๋ฌธ์ Loss์ ๋
๋ฆฝ์ ์ด๋ค.
7. ๋นํ์ ๊ณ ์ฐฐ ๋ฐ ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ(*์ ์ค์๋)
* ํด๋์ค๋ณ ์ ๋ณด ๊ณต๊ฐ์ ํฌ๊ธฐ N ์ ์ค์ ๋ก ์ธก์ ํ๊ฑฐ๋ ์ถ์ ํ๊ธฐ ์ด๋ ค์ฐ๋ฏ๋ก, ๋
ผ๋ฌธ์์๋ ๋ชจ๋ ํด๋์ค์ ๋์ผํ beta๋ฅผ ์ ์ฉํ์ต๋๋ค. ์ด๋ ํด๋์ค ๋ณ๋ก ์กฐ์ ๊ฐ๋ฅํ beta_i์ ๋ํ ์ฐ๊ตฌ์ ๊ฐ๋ฅ์ฑ์ ์ ์ํ์ต๋๋ค.
** ์ ํจ ์ํ ์๋ ์ํ ๊ฐ์ ์ ์ฌ๋์ ์์กดํ์ง๋ง, ํ์ฌ๋ ์ด๋ฅผ ๋จ์ํ ํ๋ฅ ์ ์ผ๋ก ๊ฐ์ ํ์ผ๋ฏ๋ก feature-level similarity๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ค์ธก ๊ธฐ๋ฐ ์ ํจ ์ํ ์ ๊ณ์ฐ๋ฒ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค๊ณ ํ๋จํ์์ต๋๋ค.
* CB Loss๋ ์ด ๋ฐ์ดํฐ ์์ ๋ฐ๋ผ scaling ๋๋ฏ๋ก batch-level normalization์ด ํ์ํ ์ํฉ์์๋ ๋ณด์ ๋ฐฉ์์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
REFERENCE
Class-Balanced Loss Based on Effective Number of Samples
: https://arxiv.org/abs/1901.05555
'๐ฅ๏ธ Computer Vision > ๐ฐ Paper' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
RetinaNet ๊ตฌ์กฐ์ ํ์ต ๋ฐฉ์ (2) | 2025.06.13 |
---|---|
Focal Loss: ์์ ๋ฐฐ๋ถ๊ณผ ๊ทธ๋ํ ํด์ (2) | 2025.06.09 |
MobileNet V1๊ณผ V2: ํ์ ํ๋ ๋ธ๋ก๋ค, ๋ถ๋ฆฌ๋ ์ฑ ์ (2) | 2025.06.06 |
MobileNet v2: 3.2 Linear Bottleneck ์ฝ๊ฒ ์ดํดํ๊ธฐ (0) | 2025.06.06 |
ResNet v1 vs ResNet v2 - ๋ ๊น์ด ๋ค์ฌ๋ค๋ณด๊ธฐ (2) | 2025.05.26 |