3-2. 모델 선정

검토 기준

(1) 객체검출 모델과의 호환성

해당 모듈은 객체검출 및 트래킹 모델의 끝단에 연결되며, 별도의 AI 모델을 포함하는 구성요소로서 모델 간 상호 호환성을 고려
객체검출 모델과의 연동이 가장 용이한 YOLO 기반의 Segmentattion 모델을 중심으로 검토

(2) 모델 구동의 경제성

전체 Pipline의 구동에 소요되는 시간단축이 필요하며, 추가적인 성능보완을 목적으로 구축하는 모듈임을 감안하여 자원의 효율적인 활용이 요구됨
유사 성능 내에서 데이터 처리 및 모델 구동에 소요되는 자원 최소화 방안 검토

(3) 재현 과정에서의 사용자 편의성

향후 연구내용의 재현 및 활용에 있어 사용자가 개발환경 구축과 학습 또는 추론과정을 편리하게 실행할 수 있도록 고려
라이브러리 기반으로 간편한 사용이 가능한 모델을 우선 검토

선정 모델

상기 검토 기준에 따라, Ultralytics YOLO에서 제공하는 Instance Segmentation Model을 선정함
- YOLOv8-seg를 중심으로 연구진행
- https://docs.ultralytics.com/tasks/segment/
- https://github.com/ultralytics/ultralytics/tree/main/ultralytics/models/yolo/segment

ultralytics/
└── models/
    └── yolo/
        ├── __init__.py
        ├── detect/
        │   ├── __init__.py
        │   ├── predict.py
        │   ├── train.py
        │   └── val.py
        ├── classify/
        │   ├── __init__.py
        │   ├── predict.py
        │   ├── train.py
        │   └── val.py
        └── segment/
            ├── __init__.py
            ├── predict.py
            ├── train.py
            └── val.py

해당 모델의 특성

통합 설계로 다중 작업 처리
- 객체 감지, 분류, 이미지 분할 작업을 단일 프레임워크로 지원하며, 추가 설정 없이 통합 환경에서 간단히 실행 가능
- 명확한 API 구조와 사전 학습된 가중치 제공으로 개발 초기 진입 장벽을 낮춤
유연성과 성능의 조화
- 경량화된 아키텍처와 확장 가능한 모듈식 설계로 다양한 하드웨어 환경과 복잡한 작업 요구에 대응 가능
- 작은 모델 크기를 기반으로도 정확도와 효율성을 유지 가능
학습 및 추론 최적화
- 학습 파이프라인에 자동 튜닝 기능과 효율적인 배치 처리를 적용해 메모리 사용량과 속도를 최적화
- 병렬 연산과 GPU 최적화로 대규모 데이터셋에서도 높은 처리 속도 제공
직관적인 시각화 및 디버깅 도구 제공
- 분할 결과를 직관적으로 확인할 수 있는 시각화 기능과 학습 로그 기록 지원
- 오류 원인을 탐색할 수 있는 디버깅 도구로 모델 개발 시간을 단축
다양한 응용 분야 지원
- 의료 영상 분석, 자율주행, 드론 감시 등 객체 감지와 분할이 요구되는 다양한 실제 응용 분야에서 유용하게 활용됨
- 사용자 정의 데이터셋과의 호환성을 통해 특정 도메인에 맞춘 최적화 가능

개발환경 설정

Python 기반
주요구성요소
- CUDA 11.8 지원 - NVIDIA GPU 가속을 위해 CUDA 11.8 버전 설치 필요
- PyTorch 스택:
  - PyTorch 2.0.0 (CUDA 11.8 지원 버전)
  - TorchVision 0.15.1 (이미지 처리 라이브러리)
  - TorchAudio 2.0.0 (오디오 처리 라이브러리)
- Ultralytics - YOLO를 포함한 컴퓨터 비전 작업을 위한 라이브러리 설치 필요

GitHub

.
├── utils
│   ├── segmentation
│   │   ├── README.md
│   │   ├── requirements.txt
│   │   ├── logic_v1.py
│   │   ├── logic_v2.py
│   │   ├── logic_v3.py
│   │   └── yolo_segmentation.py

CLI

https://github.com/DVA-LAB/utils/blob/main/segmentation/requirements.txtgithub.com

pip install -r requirements.txt

Previous3-1. 데이터 구축 Next3-3. 모델 학습

Last updated 1 year ago

hashtag검토 기준

hashtag(1) 객체검출 모델과의 호환성

hashtag(2) 모델 구동의 경제성

hashtag(3) 재현 과정에서의 사용자 편의성

hashtag선정 모델

hashtag해당 모델의 특성

hashtag개발환경 설정

hashtagGitHub

hashtagCLI

검토 기준

(1) 객체검출 모델과의 호환성

(2) 모델 구동의 경제성

(3) 재현 과정에서의 사용자 편의성

선정 모델

해당 모델의 특성

개발환경 설정

GitHub

CLI