Part1: Machine Learning 의 개념과 종류

Part2: 회귀분석- 통계학기초, 회귀분석, PCA

Part3: Machine Learning 알고리즘 - KNN, LDA, SVM, DecisionTree, ANN

Part4: Ensemble Learning -Bagging, Boostin, RandomForest, Stacking

Part5: Clustering - Kmeans, Hierachical, DBSCAN > 데이터를 그룹화 하는 것

Part6: Class imbalanced problem - Oversampling, Undersampling > 비정상을 추출해야 하는 데이터셋을 줬을 경우 모든데이터에 대해서 정상으로 판단하지 않도록 하는 방법

Part7: 빅콘테스트

 

* 머신러닝의 개념

 - 뜻: 위키 참조

 - 무엇(X)으로 무엇(Y)을 예측하고싶다.

 - Y를 예측하기 위해 필요한 모든 데이터는 X로 생각한다.

 - Y = f(X)

  -- Y: 출력 변수(종속적, 반응변수)

  -- f: 모형(머신 러닝 알고리즘)

  -- X: 입력변수(독립적, feature)

 

 - X와 Y의 관계를 파악하여 f를 만들거나

 - X의 특징을 파악하여 f를 만듬

 

* f란 무엇인가(회귀분석인 경우)

 - f를 구하기 위한 X(입력변수)와 Y(출력변수) 필요

 - p개의 입력 X=(X1, X2, ..., Xp)가 있을경우

  >> Y = f(X) + ε(오차항)

 - 이때 f는 정해져있지만 알 수 없는 함수

  -> 이유: 모집단(population)을 알수 없기에 sample(학습데이터)를 뽑아서 f를 추정함

      머신러닝을 이용하여 $\hat{Y} = \hat{f}(X)$ 를 만들게 됨

 

 

Posted by 문베디드

댓글을 달아 주세요