AI Data
AI 학습 데이터 구축 서비스
라벨링 스펙 큐레이션
(Specification & Curation)
▷ 연구 목적 검토
▷ 샘플 데이터(이미지,비디오,오디오 등)의
특성 파악
▷ 최종 데이터셋 가이드에 적합한
작업 단계 기획
✔ 기간 및 예산 수립
✔ 데이터 수집 전략
✔ 정제 방식
✔ Annotation 타입 결정
(Bounding box, Key-point, Polygon 등)
✔ 오브젝트 클래스(데이터 코드) 설정
✔ 목표 작업 쿼터 결정
✔ 라벨링 시 발생하는 경우의 수에 대한
메뉴얼 정리
▷ 단계별 메뉴얼 제작
데이터 수집
(Data Collection)
▷ 수집 계획 수립
▷ 수집 데이터 종류
✔ VIDEO / AUDIO
✔ IMAGE
✔ SURVEY
✔ TEXT
▷ 원천 데이터 수집 방안 기획
✔ 수집 방법
✔ 데이터 쿼터 분류
✔ 저장 및 관리 방식
✔ 투입 인력
▷ 데이터 수집 방식
✔ 데이터 구매처 협의
✔ 데이터 수집 인력 모집
✔ 자체 제작(직접 촬영 / 녹음)
▷ 데이터 검수
✔ 품질(해상도 등)
✔ 가이드 준수 여부
✔ 쿼터 수량
메타 데이터 셋
(Meta Data Set)
▷ 메타 데이터 작성 계획 수립
▷ 메타 데이터 셋 진행
✔ 메타 데이터 가이드 숙지
✔ 데이터 네이밍
✔ 메타 정보 추출
✔ Annotation 메타 정보 추출
✔ 라벨링 메타 정보 추출
(Json, coco, LAB data 등)
✔ Recognition & 메타 정보 추출
✔ 추출된 메타 데이터 병합
정제 & 업로드
(Data editing & Task open)
▷ 편집자 교육 자료 제작
▷ 정제 준비사항
✔ 작업자별 데이터 배분
✔ 유효 데이터 선별 기준
✔ 편집 가이드 라인
✔ 저장 방식
✔ 결과 기록 공유 방식
✔ 결과물 검수
▷ 데이터 정제 방식
✔ VIDEO to VIDEO
✔ VIDEO to IMAGE
✔ IMAGE to IMAGE
✔ VIDEO to AUDIO
✔ AUDIO to AUDIO
▷ 데이터 업로드
✔ 데이터 라벨링에 투입될 워커 유형에
적합한 데이터를 구분하여 TASK 생성
✔ 효과적인 TASK 제목 설정
데이터 라벨링 & 검수
(Labeling & Confirm)
▷ 라벨러(워커) 교육 자료 제작
▷ 라벨러 모집 및 체크사항
✔ 유사 작업 경력
✔ 작업 환경(인터넷, PC 등)
✔ 기간 내 투입 가능 시간
✔ 참여 목적 및 목표 등
▷ 라벨러 구분 관리
✔ 투입 가능 시간대별 구분
✔ 공동 대화방 개설
✔ 개인별 목표 작업량 제공
✔ 투입 인력
▷ 검수 관리자 운영
✔ 일반과 전문 레벨별 교차 검수
✔ 365일 1일 20시간 운영
✔ 검수자간 검수 기준 일체화
✔ 라벨러와 동일 일정에 검수 진행
✔ 실시간 검수과정을 통한 교육 병행
✔ 검수자 1명에 라벨러 n명 고정 배치
▷ 데이터 검수
✔ 품질(해상도 등)
✔ 가이드 준수 여부
✔ 쿼터 수량