본문 바로가기

전체 글44

[DataAnalysis with Crossfit] Ep.1-3 연관규칙분석 분석 기간 : 2023.04.17 ~ 이전 글에서는 데이터를 활용해서 유의미한 시각화 자료와 탐색적 데이터 분석 진행을 다뤄보았다. [DataAnalysis with Crossfit] Ep.1-2 시각화 및 EDA 2 분석 기간 : 2023.04.17 ~ 이전 글에서는 데이터를 활용해서 유의미한 시각화 자료와 탐색적 데이터 분석 1을 진행해 보았다. [DataAnalysis with Crossfit] Ep.1-2 시각화 및 EDA 1 분석 기간 : 2023.04.17 ~ 이전 글 py-moon.tistory.com 이번 글에서는 와드 중에서 나온 동작들 간의 규칙을 분석해 보는 연관규칙분석을 진행해 보겠다. 특정 요일을 집중적으로 파헤치기 위해 나는 수요일 와드를 가지고 연관규칙분석을 진행하고자 한다. .. 2023. 4. 26.
[DataAnalysis with Crossfit] Ep.1-2 시각화 및 EDA 2 분석 기간 : 2023.04.17 ~ 이전 글에서는 데이터를 활용해서 유의미한 시각화 자료와 탐색적 데이터 분석 1을 진행해 보았다. [DataAnalysis with Crossfit] Ep.1-2 시각화 및 EDA 1 분석 기간 : 2023.04.17 ~ 이전 글에서는 데이터를 수집한 과정과 정제과정을 진행하고 전처리까지 진행한 기록을 적어보았다. [DataAnalysis with Crossfit] Ep.1-1 데이터 수집 및 전처리 분석 기간 : 2023.04.1 py-moon.tistory.com 이번 글에서도 마찬가지로 탐색적 데이터 분석 1과 이어지는 나머지 시각화 내용을 다뤄보겠다. 정제했던 데이터 중 화요일 와드, 수요일 와드, 금요일 와드가 남아있다. 이번에는 이 세 와드에 대한 시각자료와.. 2023. 4. 26.
[DataAnalysis with Crossfit] Ep.1-2 시각화 및 EDA 1 분석 기간 : 2023.04.17 ~ 이전 글에서는 데이터를 수집한 과정과 정제과정을 진행하고 전처리까지 진행한 기록을 적어보았다. [DataAnalysis with Crossfit] Ep.1-1 데이터 수집 및 전처리 분석 기간 : 2023.04.17 ~ 이전 글에서 이번 분석과제의 목적과 의도를 설명해 보았다. [DataAnalysis with Crossfit] Ep.1-0 목적과 의도 분석 기간 : 2023.04.17 ~ Crossfit은 여러 종류의 운동을 섞어 단시간, 고강 py-moon.tistory.com 이번 글에서는 데이터를 활용해서 유의미한 시각화 자료와 탐색적 데이터 분석을 진행해 본다. 1 2 3 4 5 6 7 8 9 print(train.shape, train_0.shape, tr.. 2023. 4. 26.
[DataAnalysis with Crossfit] Ep.1-1 데이터 수집 및 전처리 분석 기간 : 2023.04.17 ~ 이전 글에서 이번 분석과제의 목적과 의도를 설명해 보았다. [DataAnalysis with Crossfit] Ep.1-0 목적과 의도 분석 기간 : 2023.04.17 ~ Crossfit은 여러 종류의 운동을 섞어 단시간, 고강도로 수행하는 운동이다. 여기서 여러 종류의 운동이라 함은 리프팅, 역도, 체조, 유산소를 비롯한 줄넘기, 메디신볼, 덤벨, py-moon.tistory.com 이번 글에서는 데이터를 수집한 과정과 정제과정을 진행하고 전처리까지 진행한 기록을 적어보고자 한다. 위 사진은 와드를 일일이 엑셀시트에 작성한 형태이다. Date칼럼은 날짜를 나타내고, Strength칼럼은 해당 날짜에 진행한 Strength 동작을 나타낸다. First, Second.. 2023. 4. 26.
[DataAnalysis with Crossfit] Ep.1-0 목적과 의도 분석 기간 : 2023.04.17 ~ Crossfit은 여러 종류의 운동을 섞어 단시간, 고강도로 수행하는 운동이다. 여기서 여러 종류의 운동이라 함은 리프팅, 역도, 체조, 유산소를 비롯한 줄넘기, 메디신볼, 덤벨, 케틀벨, 그리고 각종 머신들(로잉, 에어 바이크, 트레드밀, 스키, 어썰트 바이크)을 얘기한다. Crossfit에서는 오늘의 운동을 뜻하는 와드(WOD, Workout Of the Day)라는 용어를 사용한다. 이 와드라는 것이 내가 이번 분석과제로 선정하게 된 요소이다. 와드는 지도자에 해당하는 코치님이 랜덤 하지만 체계적인 동작들로 매일매일 다르게 구성해 주신다. 즉, 내일 어떤 동작하고 몇 개를 얼마나 할지는 코치님만 안다는 말이다. 내가 1년 9개월 동안 Crossfit을 하고 있는.. 2023. 4. 26.
[의사결정 나무, Decision Tree] with Python 데이터를 분류하고 예측하는 결정에 이르기 위해 특정 기준에 따라 'yes/no'로 답할 수 있는 질문을 이어나가면서 학습하는 의사결정나무(DecisionTree)에 대해서 정리해 보자. 이 전의 머신러닝 파트에서는 나이브베이즈 분류를 BernoulliNB를 통해서 실습해 보았다. [나이브 베이즈 분류Naive Bayes Classification] - BernoulliNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 BernoulliNB에 대해서 알아볼 것이다. 이 전의 머 py-moon.tistory.com 의사결정나무(DecisionTree)는 원본 데이터에서 하나의 규칙.. 2023. 2. 21.
[나이브 베이즈 분류, Naive Bayes Classification] - BernoulliNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 BernoulliNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 MultinomialNB에 대해서 알아보며 실습해 보았다. [나이브 베이즈 분류Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 py-moon.tistory.com 나이브(Naive).. 2023. 2. 19.
[나이브 베이즈 분류, Naive Bayes Classification] - MultinomialNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 MultinomialNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 나이브베이즈(NaiveBayes) 기법 중 GaussianNB에 대해서 알아보며 실습해 보았다. 나이브 베이즈 분류(Naive Bayes Classification) - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머 py-moon.tistory.com 나이브(Naive)는 직역하.. 2023. 2. 17.
[나이브 베이즈 분류, Naive Bayes Classification] - GaussianNB with Python 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법인 나이브베이즈(NaiveBayes)에 대해서 정리해 보자. 그중에서 오늘은 GaussianNB에 대해서 알아볼 것이다. 이 전의 머신러닝에서는 앙상블 기법 중 랜덤포레스트에 대해서 분류와 회귀를 실습해 보았다. 앙상블(Ensemble) - RandomForest with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 부스팅(Bo py-moon.tistory.com 나이브(Naive)는 직역하면 단순하다, 순진하다는 의미를 가진다. 베이즈(Bayes)는 베이지안 통계를 기반으로 .. 2023. 2. 15.
[앙상블, Ensemble] - RandomForest with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 부스팅(Boosting)에 대해서 다뤄보며 분류 알고리즘뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. 앙상블(Ensemble) - Boosting with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 배깅(Baggi py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스팅(Boosting), .. 2023. 2. 13.
[앙상블, Ensemble] - Boosting with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 앙상블 기법 중에서 배깅(Bagging)에 대해서 다뤄보며 분류 알고리즘뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. 앙상블(Ensemble) - Bagging with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 K-최근접 이웃(K-Nearest Neighbor, py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스팅(Boost.. 2023. 2. 11.
[앙상블, Ensemble] - Bagging with Python 단일 결정트리의 단점을 극복하기 위해 여러 머신러닝 모델을 연결하여 더 강력한 모델을 방법인 앙상블(Ensemble)에 대해서 알아보자. 이 전의 머신러닝에서 우리는 K-최근접 이웃(K-Nearest Neighbor, KNN)에 대해서 다뤄보며 분류 알고리즘 뿐 아니라 회귀 알고리즘에 대해서도 알아보았다. K-최근접 이웃(K-Nearest Neighbor, KNN) with Python 유사한 특성을 가진 데이터는 유사한 범주에 속하는 경향이 있다는 가정으로 데이터를 분류하는 K-최근접 이웃(KNN)에 대해서 정리해 보자. 이 전의 머신러닝에서는 초평면과 마진의 개념으로 분 py-moon.tistory.com 앙상블 기법에는 기본적으로 배깅(Bagging, Bootstrap Aggregating), 부스.. 2023. 2. 9.