*회귀분석
- 지도학습(Supervised learning)
Y = f(X) 에 대하여 입력변수(X)와 출력 변수 (Y)의 관계에 대하여 모델링 하는 것
(Y에 대한 예측이나 분류하는 문제)
-- 회귀(regression): 입력 변수 X에 대해서 연속형 출력변수 Y를 예측
-- 분류(classification): 입력 변수 X에 대해서 이산형 출력 변수 Y(class)를 예측
- 입력 변수인 X의 정보를 활용하여 출력 변수인 Y를 예측하는 방법
- 회귀분석 중 간단한 방법으로는 선형회귀분석이 있으며, 이를 바탕으로 복잡한 비선형 회귀 가능
- 대부분의 분류모델(SVM, Decision Tree등)으로 회귀 가능
* 단순선형회귀분석
- 변수가 하나일때 하는 방법
- 여러개라면 다중선형회귀분석
- 실제 $\beta_0 \text{와} \beta_1$은 구할 수 없는 계수로 데이터(학습집합)을 통해 추정
- 다음 그래프의 검은점은 모집단, 빨간점은 학습집합 데이터를 뜻함
- $\hat{Y} = \hat{\beta_0} + \hat{\beta_1}X$에서 $\epsil$
- 가정