지도학습(supervised learning)
- Y = f(X)에 대하여 입력변수(X)와 출력변수(Y)의 관계에 대하여 모델링하는 것
(Y에 대한 예측, 분류)
- 회귀(regression): 입력변수 X에 대해서 연속형 출력 변수Y를 예측
-- 연속형 변수(체중, 키 등)
- 분류(classification): 익력변수 X에 대해서 이산형 출력 변수 Y(class)를 예측
-- 이산형 변수(클래스, 흡연여부, 주가의 상승/하강, 비만여부 등)
비지도 학습(unsupervised learning)
- 출력 변수(Y) 가 존재하지 않고, 입력변수 (X)간의 관계에 대해 모델링
- 군집분석 - 대표적 예시
- PCA - 독립변수들의 차원을 축소화 (새로운 X,Y를 만들어서 분석해볼수 있음)
강화학습(reinforcement learning)
- 수 많은 시뮬레이션을 통해 현재의 선택(action)이 먼 미래에 보상(reward)이 최대가 되도록 학습
- Agent가 Action을 취하여 Environment의 결과인 state에 따라 reward를 받게함
- 최대 reward를 위한 최적 action을 취하는 방법을 배움