3-1. 데이터 구축

데이터 수집 방식

  • (방식) 드론에서 촬영된 영상을 Parsing하여 Images 추출

  • (출처) 직접 촬영본, 오픈데이터를 혼합하여 수집

  • (장면) 바다 포함여부와 Frame 내 차지영역이 다양하게 구성되도록 원본영상 수집

    • 전체 바다영역

    • 부분 바다영역 + 부분 육지영역

    • 전체 육지영역(바다 외 영역)

데이터 레이블링 기준

  • (방식) Instance Masking

  • (label) 1개 : sea

  • (쟁점사항) 바다영역 포함여부 판단 기준

    • 바다-육지 경계가 모호한 경우 명확하게 바다로 인식되는 영역만 포함

    • 바다 내부의 객체 포함; 바다 한 가운데 도출된 암초, 바다 위 선박 등

    • mask는 닫힌 도형(closed shapes)으로, mask 내부에 미포함되는 영역을 허용하지 않음

      • 다공성 형상(porous shapes)의 masking 없음

    • 단일 frame에 바다가 분할되어 나타난 경우, 2개 이상의 mask가 존재할 수 있음

(상)바다-육지 경계가 모호한 경우 명확하게 바다로 인식되는 영역만 포함한 예시, (하-좌측)단일 frame에 2개 이상의 mask가 존재하는 예시, (하-우측)바다 내부의 객체를 포함한 예시

데이터셋 구성

  • 구성비 균형

    • (all) Frame 전체, 바다영역 ; 33.33%

    • (part) 바다 + 그 외 영역 ; 33.33%

    • (no) Frame 전체, 그 외 영역 ; 33.33%

  • 장면 다양성 고려

  • Val, Test set 별도 구축; 완전히 상이한 영상에서 발췌

(Train Only)
images
ratio
etc.

all

206

33.33%

part

206

33.33%

Hand labeling

no

206

33.33%

total

618

100.0%

데이터셋 공유

Last updated