3-4. 최종 평가지표

정량적 평가

  • Mask Precision

    • 예측된 마스크 영역 중 실제 정답(ground truth)과 일치하는 부분의 비율

    • 잘못된 예측을 얼마나 적게 했는지를 측정하는 지표로, False Positive를 최소화하는 데 중점을 둠

    • IoU(Intersection over Union) 임계값을 기준으로, 그 이상인 예측을 True Positive로 판단하여 계산

  • Mask Recall

    • 실제 정답(ground truth) 중 예측된 마스크와 일치하는 부분의 비율.

    • 정답을 얼마나 잘 찾아냈는지를 측정하는 지표로, False Negative를 최소화하는 데 중점을 둠

  • Mask mAP50

    • IoU 임계값이 0.50일 때 평균 정밀도(Precision)를 측정한 값

    • IoU는 예측된 마스크와 정답 마스크의 겹치는 정도를 나타내며, 0.50 이상 겹치면 True Positive로 간주

    • 각 클래스별 PR(Precision-Recall) 곡선의 면적(AP)을 계산한 후, 모든 클래스의 AP를 평균

  • Mask mAP50-90

    • IoU 임계값을 0.50에서 0.95까지 0.05 단위로 변화시키면서 평균 정밀도(AP)를 측정한 값의 평균

    • 더 높은 IoU에서 얼마나 잘 맞는지 측정하므로, 모델의 정확도를 더욱 엄격하게 평가하는 방식

    • 각 IoU 임계값(0.5, 0.55, 0.6, ..., 0.95)에서의 mAP를 계산하고 평균

circle-info

상기 4개 지표에 관한 결과를 모두 측정하고 이를 검토하되,

전반적인 모델성능의 정량평가 기준으로 Mask mAP50를 우선하여 비교

정성적 평가

  • 객체 포함성

    • Mask의 객체 경계부의 세밀한 표현보다는,

    • 단순한 형태로 묘사되더라도 타겟영역을 누락없이 포함하였는지를 중요시 판단

  • 검출 일관성

    • 연속된 장면에서 일관된 성능을 보유하는지 판단

    • 유사한 유형의 객체에 대한 일관된 성능을 보유하는지 판단

  • 다양성 대응력

    • 영상촬영 장소, 시기, 방식 등이 상이한 다양한 환경이나 조건에서 성능 판단

    • unseen data를 통한 테스트 실시

Last updated