
Computer Vision(컴퓨터 비전)?
Computer + Vision의 합성어로, 시각 데이터를 처리·이해하는 분야를 뜻한다.
카메라와 센서가 인간의 눈 역할을 한다면, 컴퓨터 비전은 이러한 시각 데이터를 처리·해석하는 인지 능력이다.
AI가 컴퓨터에 “생각”을 부여한다면,
컴퓨터 비전은 컴퓨터가 보고 관찰하며 이해하도록 만드는 기술이라고 할 수 있다.
컴퓨터 비전의 주요 과제
- Classification (이미지 분류)
- Object Detection (객체 탐지)
- Image Segmentation (이미지 분할)
- Semantic Segmentation
- Instance Segmentation
- Panoptic Segmentation

1. Classification (이미지 분류)

이미지를 클래스(범주)별로 분류하는 작업이다.
주로 지도 학습(Supervised Learning)으로 수행되며,
기존 데이터에서 각 클래스 간의 관계를 학습하고
새롭게 관측된 이미지가 어느 클래스에 속하는지 스스로 판별한다.
2. Object Detection (객체 탐지)

이미지 속 여러 객체의 위치를 찾고, 동시에 클래스를 분류하는 작업이다.
주로 바운딩 박스(Bounding Box)를 이용해 객체의 위치를 표시하고, 각 박스 안의 객체가 무엇인지 분류한다.
3. Image Segmentation (이미지 분할)

이미지를 픽셀 단위로 분석해 관심 객체를 추출·분류하는 작업이다.
Object Detection이 객체의 대략적 위치만 알려주는 데 비해,
Image Segmentation은 각 픽셀이 어떤 객체에 속하는지까지 파악해 더 정밀한 위치와 모양 정보를 제공한다.
3.1. Image Segmentation 종류
Semantic Segmentation

이미지를 사람이 이해할 수 있는 의미 단위(클래스)별로 구분하는 방식이다.
즉, 이미지의 각 픽셀을 사람, 자동차, 비행기 등과 같은 물리적 의미 단위(클래스)로 분류한다.
Instance Segmentation

시맨틱 세그멘테이션이 클래스별 구분이라면, 인스턴스 세그멘테이션은 개별 객체(인스턴스)별 구분이다.
같은 클래스(예: 사람)라도 사람1, 사람2, 사람3처럼 각각 다른 인스턴스로 식별해 분리한다.
Panoptic Segmentation

시맨틱 세그멘테이션과 인스턴스 세그멘테이션을 결합한 방식이다.
각 픽셀에 클래스(class)와 인스턴스 ID(instance id)를 함께 부여하여
물체와 배경을 모두 인스턴스 단위로 구분한다.
- 인스턴스 세그멘테이션은 주로 물체 인스턴스 구분에 초점을 두고 배경은 신경 쓰지 않는다.
- 시맨틱 세그멘테이션은 배경까지 포함한 클래스 분류가 가능하다.
- 파놉틱 세그멘테이션은 두 방식을 통합해 물체와 배경을 모두 포괄적으로 식별한다.
요약
