(실험02.) input image size별 성능비교

1. Intro

실험의 목적

  • 입력 이미지 크기별 성능변화 분석

    • 입력 이미지 크기에 따른 모델의 정확도, 정밀도 등 성능 변화

  • 연산 효율성 평가

    • 이미지 크기에 따른 처리 속도, 연산 비용 등의 자원 소모 변화 분석

  • 모델 유연성 확인

    • 다양한 해상도에서 모델이 일관된 성능을 유지하는지 검증

기대 효과

  • 해당 task에 적정한 Input Image size 판단 및 성능 평가

  • 한정된 리소스 및 서브모듈로서의 역할범위를 고려하여 적정개발의 방향 설정

2. Setup

  • Input Image Size

    • Resize=640

    • Resize=1280

    • Resize=1920

3. Methodology

세부 실험방법

  • 모델 구성

    • (basic model)YOLOv8s-seg 기준

  • 파라미터 설정

    • 공식 페이지에서 공개한 default 설정 적용

  • 실험 절차

    • Resize 설정을 640 -> 1280 -> 1920 으로 변경하며 결과값을 비교

    • 이미지 사이즈 이외의 모든 설정은 동일하게 통제

4. Results

실험 결과 요약

  • Mask Precision, Mask Recall, Mask mAP50, Mask mAP50-95를 비교

-
Resize
Precision
Recall
mAP 50
mAP 50-95

(Default)

640

0.916

0.857

0.921

0.882

1280

0.927

0.929

0.930

0.479

1920

0.298

0.214

0.148

0.076

결과 시각화

  • 위에서부터 Resize=640, 1280, 1920

Resize=640
Resize=1280
Resize=1920

결과 기록

시사점

  • Input Image Size를 확대하는 것이 해당 task에서의 성능향상을 보장하지는 않는다고 판단됨

  • 특히 1920으로 사이즈를 증가하여 학습한 경우, 학습이 제대로 이루어지지 않는 것으로 나타남

    • 해당 모델 상에서 640 외 사이즈에 대한 처리 자체에 오류가 있을 수 있다고도 판단됨

  • 반면, 모델학습에 소요되는 시간은 Resize=640(0.2h)을 기준으로, Resize=1280(1.7h)은 8.5배 증가, Resize=1940(24.2h)은 121.0배 증가하여 자원소모가 극명하게 늘어나는 것을 알 수 있음

Last updated