본문 바로가기

통계11

[나이브 베이즈 분류, Naive Bayes Classification] - BernoulliNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 BernoulliNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 MultinomialNB에 대해서 알아보며 실습해 보았다. [나이브 베이즈 분류Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 py-moon.tistory.com 나이브(Naive).. 2023. 2. 19.
[나이브 베이즈 분류, Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 GaussianNB에 대해서 알아보며 실습해 보았다. 나이브 베이즈 분류(Naive Bayes Classification) - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머 py-moon.tistory.com 나이브(Naive)는 직역하.. 2023. 2. 17.
[나이브 베이즈 분류, Naive Bayes Classification] - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 앙상블 기법 중 랜덤포레스트에 대해서 분류와 회귀를 실습해 보았다. 앙상블(Ensemble) - RandomForest with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 부스팅(Bo py-moon.tistory.com 나이브(Naive)는 직역하면 단순하다, 순진하다는 의미를 가진다. 베이즈(Bayes)는 베이지안 통계를 기반으로 .. 2023. 2. 15.
[교차분석, ChiSquare Test] with Python 각 범주에 따른 종속변수의 분포를 설명하거나, 두 변수가 서로 연관성이 있는지를 검정하는 교차분석 즉, 카이제곱 검정을 통해 정리해 보자. 이전엔 다중 회귀분석과 다중공선성에 대해서 정리해 보았다. 다중 회귀분석 - 다중공선성 다중 선형 회귀분석 중에서 필수적으로 해결해야 하는 것인 다중공선성에 대해 정리해보고자 한다. 다중공선성 : 다중 회귀분석에서 독립변수들 간에 강한 상관관계가 나타나는 문제 단순 선형 py-moon.tistory.com 이전에 T검정과 분산분석에서는 종속변수가 연속형 변수였지만 카이제곱 검정은 독립변수, 종속변수 둘 다 범주형 변수인 경우에 사용한다. 카이제곱 검정은 검정의 목적에 따라 3가지 검정으로 분류된다. 관찰빈도가 기대분포를 따르는지 검정하는 경우 -> 적합성 검정 두 개.. 2023. 1. 12.
[다중 회귀분석, Multiple Regression] - 다중공선성 with Python 다중 선형 회귀분석 중에서 필수적으로 해결해야 하는 것인 다중공선성에 대해 정리해보고자 한다. 이 전엔 선형 회귀분석에 대해서 정리해 보았다. 선형 회귀분석(Linear Regression) 하나 혹은 그 이상의 원인(독립변수)이 종속변수에 미치는 영향을 추적해서 식으로 표현하는 회귀분석을 복습해 보자. 회귀분석의 검토사항 모형이 데이터를 잘 적합하고 있는가? 회귀모형이 py-moon.tistory.com 다중공선성 : 다중 회귀분석에서 독립변수들 간에 강한 상관관계가 나타나는 문제 단순 선형 회귀분석과 다중 선형 회귀분석의 차이점은 독립변수의 수이다. 단순 선형 회귀분석 -> 독립변수 1개, 종속변수 1개 다중 선형 회귀분석 -> 독립변수 2개 이상, 종속변수 1개 다중 선형 회귀분석에서 다중공선성을 .. 2023. 1. 10.
[선형 회귀분석, Linear Regression] with Python 하나 혹은 그 이상의 원인(독립변수)이 종속변수에 미치는 영향을 추적해서 식으로 표현하는 회귀분석을 복습해 보자. 이 전엔 이원배치 분산분석(Two-way ANOVA)에 대해서 정리해 보았다. 이원배치 분산분석(Two-way ANOVA) 두 개 이상의 다수 집단 간 평균은 비교하는 분산분석에서 이원배치 분산분석을 복습해 보자. 기본가정 정규성, 독립성을 만족한다 (아닐 시 Friedman test진행) 등분산성을 만족한다 (아닐 시 Welch`s py-moon.tistory.com 회귀분석의 검토사항 모형이 데이터를 잘 적합하고 있는가? 회귀모형이 통계적으로 유의한가? 모형은 데이터를 얼마나 설명할 수 있는가? 모형 내의 회귀계수는 유의한가? 회귀분석은 kc_house_data를 활용해서 정리하고자 한다.. 2023. 1. 8.
[이원배치 분산분석, Two-way ANOVA] with Python 두 개 이상의 다수 집단 간 평균은 비교하는 분산분석에서 이원배치 분산분석을 복습해 보자. 이 전엔 일원배치 분산분석(One-way ANOVA)에 대해서 정리해 보았다. 일원배치 분산분석(One-way ANOVA) 두 개 이상의 다수 집단 간 평균은 비교하는 분산분석에서 일원배치 분산분석을 복습해 보자. 기본가정 및 조건 정규성, 독립성을 만족한다 (아닐 시 Kruskal-Wallis test진행) 등분산성을 만족한다 ( py-moon.tistory.com 기본가정 정규성, 독립성을 만족한다 (아닐 시 Friedman test진행) 등분산성을 만족한다 (아닐 시 Welch`s ANOVA진행) 종속변수는 1개 연속형, 독립변수는 2개 범주형 사후검정 진행 교호작용 효과(두 요인이 동시에 미치는 영향) 이원.. 2023. 1. 6.
[일원배치 분산분석, One-way ANOVA] with Python 두 개 이상의 다수 집단 간 평균은 비교하는 분산분석에서 일원배치 분산분석을 복습해 보자. 이 전엔 독립표본 T-검정에 대해서 정리하면서 복습해 보았다. 독립표본 T-검정 두 집간 간의 평균 차이를 검정하는 T검정에서 독립표본 T-검정을 복습해보자. 기본가정 정규성 만족 (아닐 시 윌콕슨이 부호 순위 검정, 맨휘트니 검정) 등분산성 만족 (아닐 시 Welch`s t-test) 종속 py-moon.tistory.com 기본가정 및 조건 정규성, 독립성을 만족한다 (아닐 시 Kruskal-Wallis test진행) 등분산성을 만족한다 (아닐 시 Welch`s ANOVA진행) 종속변수는 1개 연속형, 독립변수는 1개 범주형 사후검정 진행 주효과(각각의 요인에 의한 효과) 일원배치 분산분석은 iris데이터를 활.. 2023. 1. 2.
[독립표본 T-검정, Independent Sample T-Test] with Python 두 집간 간의 평균 차이를 검정하는 T검정에서 독립표본 T-검정을 복습해보자. 이 전엔 대응표본 T-검정에 대해서 정리하고 복습해 보았다. 대응표본 T-검정 두 집간 간의 평균 차이를 검정하는 T검정에서 대응표본 T-검정을 복습해보자. 기본가정 정규성 만족 (아닐 시 윌콕슨의 부호 순위 검정) 종속변수는 연속형, 독립변수 1개 범주형 짝(개수) 만족 . py-moon.tistory.com 기본가정 정규성 만족 (아닐 시 윌콕슨이 부호 순위 검정, 맨휘트니 검정) 등분산성 만족 (아닐 시 Welch`s t-test) 종속변수는 연속형, 독립변수는 1개 범주형 독립표본 T검정에 대한 정리는 고양이에 대한 데이터를 통해 진행해 보겠다. 1 2 3 4 import pandas as pd cats = pd.rea.. 2022. 12. 29.
[대응표본 T-검정, Paired Samles T-Test] with Python 두 집간 간의 평균 차이를 검정하는 T검정에서 대응표본 T-검정을 복습해보자. 이 전엔 일표본 T-검정에 대해서 정리해보고 복습해 보았다. 일표본 T-검정 두 집간 간의 평균 차이를 검정하는 T검정에서 일표본 T-검정을 복습해보자. 기본가정 정규성 만족 (아닐 시 윌콕슨의 부호 순위 검정) 종속변수는 연속형, 독립변수 범주형 검증하고자 하는 기 py-moon.tistory.com 기본가정 정규성 만족 (아닐 시 윌콕슨의 부호 순위 검정) 종속변수는 연속형, 독립변수 1개 범주형 짝(개수) 만족 . 1 2 3 4 5 6 import pandas as pd data = {'before':[7,3,4,5,2,1,6,6,5,4], 'after':[8,4,5,6,2,3,6,8,6,5]} data = pd.Data.. 2022. 12. 27.