본문 바로가기
Experience/- KT AIVLE School

KT AIVLE School 7주차 정리 - Object Detection

by Yoojacha 2023. 3. 15.

23.03.17 이렇게 정리를 하지만.. 논문이나 책을 참고한 것이 아니므로 가볍게 읽어주세요!


Object Detection

  • Bounding box, Classification, Confidence Score + CNN
  • bounding box regression + multi class classification 이 합쳐진 문제로 이해
  • localization + classification 이 합쳐진 문제로 이해

CNN 의 역할

뼈대로서의 기능 (Backbone) + < 연결을 도와주는 Neck 도 있음 > + 우리 문제에 맞춰서 추가 구성 (Head)


Bounding box

  • 하나의 object가 포함되어 있는 최소크기의 박스
  • 좌표 x, y, 크기 w, h에 대한 예측값을 만들어 내고 여기에 다가가기를 기대한다.
  • IoU를 다룰 때 Corner Coordinates를 사용 (Center Coordinates를 사용하는 경우도 있음)
  • 사용할 모델, dataset 등에 따라 annotation이 다른 경우에 좌표를 변환해야 하는 경우 생김

Confidence score

  • Object가 box 안에 있을 확률
  • box 들 중에 confidence score가 가장 높은 박스 선정

NMS (Non Maximum Suppression)

  • object 주변으로 점수가 높게나오는 bounding box들이 여러개 생기는 문제를 해결해주는 기법
  • 겹쳐진 bounding box 들 중에서 class score(신뢰도)가 높은 것을 남기고 나머지 지우는 과정

IoU threshold (Intersection Over Union) thres

  • 객체 인식 모델 성능 조절 지표
  • 실제 영역대비 예측 영역이 얼마나 겹쳐져 있는지를 나타내는 지표
  • 계산식: area of overlap / area of union
  • 실제 영영과 예측 영역이 겹친 구간 (교집합) / 실제 영역과 예측영역의 모든 구간 (합집합)

YOLO (You Only Look Once)

  • One Stage Detector (위치를 찾는 것과 클래스 구분을 동시에 진행)
  • YOLO v1 ~ v4 까지는 논문 참고 가능
  • 깃허브에서 Pretrained Model 활용 가능
  • YOLO 는 1 - IoU 로 계산되기 때문에 IoU thres 가 작을수록 엄격해짐
  • non-max suppression 방식 이용
  • YOLO 버전별 동작 방식은 추후 업데이트 예정

Two Stage Detector

  • 처리속도가 느려 실시간 처리를 하지 못함 > One Stage Detector 인 YOLO 등장

Rcall 과 Precision 의 의미

Recall

  • 양성인 것을 양성으로 예측한 비율
  • 실제로 오브젝트가 있는 것을 detector가 오브젝트가 있다고 예측한 비율

Precision

  • 양성으로 예측했을 때 실제로 양성인 비율
  • detector가 오브젝트가 있다고 예측했을 때 실제로 오브젝트가 있는 비율 

mAP (평균 정밀도, mean Average Performance)

  • 모든 점 보간법을 이용한 AP를 구하는 값의 평균
  • 다중 IoU에 대한 평균 계산
  • mAP50은 IoU가 0.5 일 때 계산된 mAP 값을 의미
  • Recall을 0.1 단위로 쪼갠 후 해당 Recall 에서의 Precision 들의 평균 계산

댓글