MewwSikk
article thumbnail
CB-CE: Long-tailed Data를 다룰 수 있는 Loss 설계

Introduction이 논문은 long-tailed distribution(긴 꼬리 분포)을 갖는 데이터셋에서 deep neural network가 성능 저하를 겪는 문제에 주목합니다. 특히, 클래스 불균형 상황에서 흔히 사용되는 inverse class frequency re-weighting의 한계를 지적하며, 새로운 손실 함수인 Class-Balanced Loss를 제안합니다.핵심 아이디어는 “많은 데이터가 더 낫다”는 직관에 기반하되, 데이터가 서로 중복되거나 유사할 수 있다는 점을 고려해, 실제로 모델 학습에 기여하는 Effective Number of Samples(유효 샘플 수)를 정의하고, 이에 기반하여 손실 함수를 조정합니다.관련 연구 (Related Work)불균형 데이터에 대한 기존..