ML Concepts

기본 용어의 개념

$P(Y|X)$를 직접적으로 구하느냐 간접적으로 구하느냐에 따라 Discriminative model과 Generative model로 구분됨

Discriminative Model
- 데이터 X가 주어졌을 때 레이블 Y가 나타날 조건부 확률을 직접적으로 반환하는 모델
- 레이블 정보 Y를 필요로하기 때문에 지도학습에 해당하며 X의 레이블을 잘 구분하는 Decision Boundary를 학습하는 것을 목표로 함
Generative Model
- 데이터 X가 생성되는 과정을 두개의 확률모형 P(Y)와 P(XIY)로 모델링하며 베이즈정리를 이용해 P(YIX)를 간접적으로 도출
- P(Y)와 P(XIY)의 확률분포를 학습하는 것이 목표이며 학습한 P(XIY)를 활용해 X를 샘플링 할 수 있음

LPIPS: Learned Perceptual Image Patch Similarity
- 두 이미지의 perceptual distance를 계산하는 방식
FID: Fréchet Inception Distance
- $FID={\parallel\mu_x-\mu_y\parallel}^2 -Tr(\sum_x + \sum_y -2\sum_x\sum_y)$
- 실제 training dataset의 distribution과 생성된 영상의 distribution의 거리를 계산하는 방식
- Inception network의 중간 레이어에서 feature를 가져와, 실제 데이터와 생성된 데이터에서 얻은 feature의 평균과 공분산을 비교하는 식으로 구성
- Random Generation 성능 평가시 사용, FID가 낮을수록 좋은 성능
  seamless
뛰어난 호환성, 부드러운 상호연결성
소프트웨어분야에서 여러개의 프로그램이 마치 원래 하나였던 것처럼 깔끔한 인터페이스로 연결되어 있는 것을 뜻함
transformer가 여러 도메인(영상, 음성 등)의 task를 잘 처리하는 특징을 seamless하다고 표현