3-2. 모델 선정

검토 기준

(1) 객체검출 모델과의 호환성

  • 해당 모듈은 객체검출 및 트래킹 모델의 끝단에 연결되며, 별도의 AI 모델을 포함하는 구성요소로서 모델 간 상호 호환성을 고려

  • 객체검출 모델과의 연동이 가장 용이한 YOLO 기반의 Segmentattion 모델을 중심으로 검토

(2) 모델 구동의 경제성

  • 전체 Pipline의 구동에 소요되는 시간단축이 필요하며, 추가적인 성능보완을 목적으로 구축하는 모듈임을 감안하여 자원의 효율적인 활용이 요구됨

  • 유사 성능 내에서 데이터 처리 및 모델 구동에 소요되는 자원 최소화 방안 검토

(3) 재현 과정에서의 사용자 편의성

  • 향후 연구내용의 재현 및 활용에 있어 사용자가 개발환경 구축과 학습 또는 추론과정을 편리하게 실행할 수 있도록 고려

  • 라이브러리 기반으로 간편한 사용이 가능한 모델을 우선 검토

선정 모델

해당 모델의 특성

  • 통합 설계로 다중 작업 처리

    • 객체 감지, 분류, 이미지 분할 작업을 단일 프레임워크로 지원하며, 추가 설정 없이 통합 환경에서 간단히 실행 가능

    • 명확한 API 구조와 사전 학습된 가중치 제공으로 개발 초기 진입 장벽을 낮춤

  • 유연성과 성능의 조화

    • 경량화된 아키텍처와 확장 가능한 모듈식 설계로 다양한 하드웨어 환경과 복잡한 작업 요구에 대응 가능

    • 작은 모델 크기를 기반으로도 정확도와 효율성을 유지 가능

  • 학습 및 추론 최적화

    • 학습 파이프라인에 자동 튜닝 기능과 효율적인 배치 처리를 적용해 메모리 사용량과 속도를 최적화

    • 병렬 연산과 GPU 최적화로 대규모 데이터셋에서도 높은 처리 속도 제공

  • 직관적인 시각화 및 디버깅 도구 제공

    • 분할 결과를 직관적으로 확인할 수 있는 시각화 기능과 학습 로그 기록 지원

    • 오류 원인을 탐색할 수 있는 디버깅 도구로 모델 개발 시간을 단축

  • 다양한 응용 분야 지원

    • 의료 영상 분석, 자율주행, 드론 감시 등 객체 감지와 분할이 요구되는 다양한 실제 응용 분야에서 유용하게 활용됨

    • 사용자 정의 데이터셋과의 호환성을 통해 특정 도메인에 맞춘 최적화 가능

개발환경 설정

  • Python 기반

  • 주요구성요소

    • CUDA 11.8 지원 - NVIDIA GPU 가속을 위해 CUDA 11.8 버전 설치 필요

    • PyTorch 스택:

      • PyTorch 2.0.0 (CUDA 11.8 지원 버전)

      • TorchVision 0.15.1 (이미지 처리 라이브러리)

      • TorchAudio 2.0.0 (오디오 처리 라이브러리)

    • Ultralytics - YOLO를 포함한 컴퓨터 비전 작업을 위한 라이브러리 설치 필요

GitHub

CLI

Last updated