본문 바로가기

내가 하는 데이터분석38

[의사결정 나무, Decision Tree] with Python 데이터를 분류하고 예측하는 결정에 이르기 위해 특정 기준에 따라 'yes/no'로 답할 수 있는 질문을 이어나가면서 학습하는 의사결정나무(DecisionTree)에 대해서 정리해 보자. 이 전의 머신러닝 파트에서는 나이브베이즈 분류를 BernoulliNB를 통해서 실습해 보았다. [나이브 베이즈 분류Naive Bayes Classification] - BernoulliNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 BernoulliNB에 대해서 알아볼 것이다. 이 전의 머 py-moon.tistory.com 의사결정나무(DecisionTree)는 원본 데이터에서 하나의 규칙.. 2023. 2. 21.
[나이브 베이즈 분류, Naive Bayes Classification] - BernoulliNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 BernoulliNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 MultinomialNB에 대해서 알아보며 실습해 보았다. [나이브 베이즈 분류Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 py-moon.tistory.com 나이브(Naive).. 2023. 2. 19.
[나이브 베이즈 분류, Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 GaussianNB에 대해서 알아보며 실습해 보았다. 나이브 베이즈 분류(Naive Bayes Classification) - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머 py-moon.tistory.com 나이브(Naive)는 직역하.. 2023. 2. 17.
[나이브 베이즈 분류, Naive Bayes Classification] - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 앙상블 기법 중 랜덤포레스트에 대해서 분류와 회귀를 실습해 보았다. 앙상블(Ensemble) - RandomForest with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 부스팅(Bo py-moon.tistory.com 나이브(Naive)는 직역하면 단순하다, 순진하다는 의미를 가진다. 베이즈(Bayes)는 베이지안 통계를 기반으로 .. 2023. 2. 15.
[앙상블, Ensemble] - RandomForest with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 부스팅(Boosting)에 대해서 다뤄보며 분류 알고리즘뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. 앙상블(Ensemble) - Boosting with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 배깅(Baggi py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스팅(Boosting), .. 2023. 2. 13.
[앙상블, Ensemble] - Boosting with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 배깅(Bagging)에 대해서 다뤄보며 분류 알고리즘뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. 앙상블(Ensemble) - Bagging with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 K-최근접 이웃(K-Nearest Neighbor, py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스팅(Boost.. 2023. 2. 11.
[앙상블, Ensemble] - Bagging with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 K-최근접 이웃(K-Nearest Neighbor, KNN)에 대해서 다뤄보며 분류 알고리즘 뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. K-최근접 이웃(K-Nearest Neighbor, KNN) with Python 유사한 특성을 가진 데이터는 유사한 범주에 속하는 경향이 있다는 가정으로 데이터를 분류하는 K-최근접 이웃(KNN)에 대해서 정리해 보자. 이 전의 머신러닝에서는 초평면과 마진의 개념으로 분 py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스.. 2023. 2. 9.
[K-최근접 이웃, K-Nearest Neighbor] KNN with Python 유사한 특성을 가진 데이터는 유사한 범주에 속하는 경향이 있다는 가정으로 데이터를 분류하는 K-최근접 이웃(KNN)에 대해서 정리해 보자. 이 전의 머신러닝에서는 초평면과 마진의 개념으로 분류와 회귀를 지원하는 서포트 벡터 머신(Support Vector Machine)에 대해서 정리해 보았다. 서포트 벡터 머신(Support Vector Machine) with Python 새로운 데이터가 입력되었을 때, 기존 데이터를 활용해서 분류하는 방법인 서포트 벡터 머신(Support Vector Machine)에 대해서 다뤄보자. 이 전의 머신러닝에서는 로지스틱 회귀를 이용해서 이진 분 py-moon.tistory.com KNN의 기본원리는 이러하다. 학습데이터를 그대로 저장한 뒤 새로운 데이터 포인트에 대해.. 2023. 2. 7.
[서포트 벡터 머신, Support Vector Machine] SVM with Python 새로운 데이터가 입력되었을 때, 기존 데이터를 활용해서 분류하는 방법인 서포트 벡터 머신(Support Vector Machine)에 대해서 다뤄보자. 이 전의 머신러닝에서는 로지스틱 회귀를 이용해서 이진 분류와 다중 분류를 진행해 보았다. 로지스틱 회귀(Logistic Regression Model) with Python 선형 회귀모델을 분류로 사용해서 샘플이 특정 클래스에 속할 확률을 추정하는 데 사용하는 기법인 로지스틱 회귀(Logistic Regression)에 대해서 다뤄보자. 이 전의 머신러닝에서는 다중 회귀(Multiple py-moon.tistory.com 서포트 벡터 머신은 지도학습 모델로서 회귀와 분류 문제를 해결할 때 사용되는 알고리즘이다. 회귀와 분류에서 사용되는 알고리즘이 다른데 .. 2023. 2. 5.
[로지스틱 회귀, Logistic Regression] with Python 선형 회귀모델을 분류로 사용해서 샘플이 특정 클래스에 속할 확률을 추정하는 데 사용하는 기법인 로지스틱 회귀(Logistic Regression)에 대해서 다뤄보자. 이 전의 머신러닝에서는 다중 회귀(Multiple Regression)에 대해서 다뤄보며 L1규제, L2규제, Elastic net에 대한 내용도 다뤄보았다. 다중 회귀(Multiple Regression Model) with Python 여러 개의 독립변수와 한 개의 종속변수로 이루어진 회귀 분석인 다중 회귀(Multiple Regression) 분석에 대해서 정리해보고자 한다. 이 전글에서 머신러닝 중 다항 회귀(Polynomial Regression)에 대해서 정 py-moon.tistory.com 로지스틱 회귀분석은 종속변수의 수치를.. 2023. 2. 3.