Part1: Machine Learning 의 개념과 종류
Part2: 회귀분석- 통계학기초, 회귀분석, PCA
Part3: Machine Learning 알고리즘 - KNN, LDA, SVM, DecisionTree, ANN
Part4: Ensemble Learning -Bagging, Boostin, RandomForest, Stacking
Part5: Clustering - Kmeans, Hierachical, DBSCAN > 데이터를 그룹화 하는 것
Part6: Class imbalanced problem - Oversampling, Undersampling > 비정상을 추출해야 하는 데이터셋을 줬을 경우 모든데이터에 대해서 정상으로 판단하지 않도록 하는 방법
Part7: 빅콘테스트
* 머신러닝의 개념
- 뜻: 위키 참조
- 무엇(X)으로 무엇(Y)을 예측하고싶다.
- Y를 예측하기 위해 필요한 모든 데이터는 X로 생각한다.
- Y = f(X)
-- Y: 출력 변수(종속적, 반응변수)
-- f: 모형(머신 러닝 알고리즘)
-- X: 입력변수(독립적, feature)
- X와 Y의 관계를 파악하여 f를 만들거나
- X의 특징을 파악하여 f를 만듬
* f란 무엇인가(회귀분석인 경우)
- f를 구하기 위한 X(입력변수)와 Y(출력변수) 필요
- p개의 입력 X=(X1, X2, ..., Xp)가 있을경우
>> Y = f(X) + ε(오차항)
- 이때 f는 정해져있지만 알 수 없는 함수
-> 이유: 모집단(population)을 알수 없기에 sample(학습데이터)를 뽑아서 f를 추정함
머신러닝을 이용하여 $\hat{Y} = \hat{f}(X)$ 를 만들게 됨