(실험02.) input image size별 성능비교

1. Intro

실험의 목적

입력 이미지 크기별 성능변화 분석
- 입력 이미지 크기에 따른 모델의 정확도, 정밀도 등 성능 변화
연산 효율성 평가
- 이미지 크기에 따른 처리 속도, 연산 비용 등의 자원 소모 변화 분석
모델 유연성 확인
- 다양한 해상도에서 모델이 일관된 성능을 유지하는지 검증

기대 효과

해당 task에 적정한 Input Image size 판단 및 성능 평가
한정된 리소스 및 서브모듈로서의 역할범위를 고려하여 적정개발의 방향 설정

2. Setup

Input Image Size
- Resize=640
- Resize=1280
- Resize=1920

3. Methodology

세부 실험방법

모델 구성
- (basic model)YOLOv8s-seg 기준
파라미터 설정
- 공식 페이지에서 공개한 default 설정 적용
실험 절차
- Resize 설정을 640 -> 1280 -> 1920 으로 변경하며 결과값을 비교
- 이미지 사이즈 이외의 모든 설정은 동일하게 통제

4. Results

실험 결과 요약

Mask Precision, Mask Recall, Mask mAP50, Mask mAP50-95를 비교

-

Resize

Precision

Recall

mAP 50

mAP 50-95

(Default)

640

0.916

0.857

0.921

0.882

1280

0.927

0.929

0.930

0.479

1920

0.298

0.214

0.148

0.076

결과 시각화

위에서부터 Resize=640, 1280, 1920

결과 기록

시사점

Input Image Size를 확대하는 것이 해당 task에서의 성능향상을 보장하지는 않는다고 판단됨
특히 1920으로 사이즈를 증가하여 학습한 경우, 학습이 제대로 이루어지지 않는 것으로 나타남
- 해당 모델 상에서 640 외 사이즈에 대한 처리 자체에 오류가 있을 수 있다고도 판단됨
반면, 모델학습에 소요되는 시간은 Resize=640(0.2h)을 기준으로, Resize=1280(1.7h)은 8.5배 증가, Resize=1940(24.2h)은 121.0배 증가하여 자원소모가 극명하게 늘어나는 것을 알 수 있음

Previous(실험01.) model size별 성능비교 Next(실험03.) 그 외 data augmentation 변경

Last updated 1 year ago