배움-데이터라벨링

데이터 유형별 라벨링 방법

CreamPPang 2022. 6. 9. 06:00
반응형

Label
라벨

1. 이미지
  -바운딩 : 마우스를 드래그하여 작업 대상에 박스를 그리는 작업
  -감정분석 : 사람의 표정을 보고 어떤 감정 상태인지 추론
  -키포인트 : 작업 대상의 특정 지점에 점을 찍는 작업
  -얼굴 랜드마크 : 얼굴 주요 부위에 점을 찍는 작업
  -OCR : 이미지 속 글자를 바운딩한 후 태깅
  -폴리곤 : 작업 대상의 외곽선을 따라 점을 찍어 점으로부터 시작해서 선의 형태로 이어져 빈 공간 없이 대상을 검출
  -폴리라인 : 작업 대상을 따라 여러 개의 점을 연속적으로 그리는 작업

2. 영상
  -바운딩 : 작업 대상을 박스에 넣어주는 작업
  -스켈레톤 추출 : 행동 패턴을 분석하기 위해 특정 부위에 점을 찍어주는 작업
  -시멘틱 세그멘테이션 : 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해내는 작업
  -특정 구간 추출 : 작업 대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택해 추출하는 작업

3. 텍스트
  -문장 의미 비교 : 주어진 문장들의 의미가 같은 것인지 여부를 태깅하는 작업
  -감정 태깅 : 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 작업
  -키워드 찾기 : 대화 내용 속에서 핵심이 되는 키워드를 찾는 작업
  -문장 요약 : 글을 읽고 핵심이 되는 내용을 요약하는 작업

4. 음성
  -화자 구분 : 제시된 음성을 모두 듣고, 동일한 사람의 목소리인지를 판단해서 태깅하는 작업
  -음성 받아쓰기 : 주어진 음성을 듣고 받아쓰는 작업

 우리 생활 속에서 접하는 데이터의 종류가 생각보다 적다는 생각이 들었어요. 위와 같이 이미지/영상/텍스트/음성 이렇게 4가지로 구분할 수 있습니다. 각 데이터 특성에 맞게 라벨링 하는 방법도 적게는 2가지에서 많게는 7가지로 나누어 집니다. 이미지마다 혹은 영상마다 나오는 정보와 데이터를 이렇게 일일이 구분해 줘야 하다니 똑똑한 인공지능(AI)도 그 시작은 결국 사람의 손에서 시작되는 건가봐요. 집에서 자주 사용하는 "기가지니"나 운전할 때 휴대전화 네비게이션 속 "아리아"도 수많은 음성 데이터를 라벨링하고 그 것을 학습 시켜서 이렇게 상용화 했다고 생각하니 새삼 인간의 위대함을 느낍니다. 그 위대한 과정에 저도 한 몫할 수 있길 바라며 오늘은 데이터 유형별 라벨링 방법에 대해 알아봤습니다.

모두 좋은 하루 보내세요~!  

반응형
LIST