본문 바로가기

Preprocessing3

[DataAnalysis with Crossfit] Ep.1-1 데이터 수집 및 전처리 분석 기간 : 2023.04.17 ~ 이전 글에서 이번 분석과제의 목적과 의도를 설명해 보았다. [DataAnalysis with Crossfit] Ep.1-0 목적과 의도 분석 기간 : 2023.04.17 ~ Crossfit은 여러 종류의 운동을 섞어 단시간, 고강도로 수행하는 운동이다. 여기서 여러 종류의 운동이라 함은 리프팅, 역도, 체조, 유산소를 비롯한 줄넘기, 메디신볼, 덤벨, py-moon.tistory.com 이번 글에서는 데이터를 수집한 과정과 정제과정을 진행하고 전처리까지 진행한 기록을 적어보고자 한다. 위 사진은 와드를 일일이 엑셀시트에 작성한 형태이다. Date칼럼은 날짜를 나타내고, Strength칼럼은 해당 날짜에 진행한 Strength 동작을 나타낸다. First, Second.. 2023. 4. 26.
내가 하는 전처리(Preprocessing) EP.02 이 전의 전처리 글에선 이상치 정제, 데이터 정규화에 대한 글을 정리하며 다뤄보았다. 내가 하는 전처리(Preprocessing) EP.01 데이터분석을 진행하다 보면 공통적으로 혹은 필수적으로 거쳐야 할 과정들이 있다. 그중 여기서 다루고자 하는 것은.. 바로 전처리 과정이다. 아래의 코드들은 실제로 내가 분석을 진행할 때 py-moon.tistory.com 이번 전처리에서는 데이터 스케일링에 대해서 정리해보고자 한다. 데이터 스케일링은 크게는 범주형과 수치형 데이터 스케일링으로 구분한다. 해당 순서에 맞게 적어보려 한다. 1 2 3 4 import pandas as pd import numpy as np import seaborn as sns from scipy import stats cs > 먼저,.. 2023. 1. 24.
내가 하는 전처리(Preprocessing) EP.01 데이터분석을 진행하다 보면 공통적으로 혹은 필수적으로 거쳐야 할 과정들이 있다. 그중 여기서 다루고자 하는 것은.. 바로 전처리 과정이다. 아래의 코드들은 실제로 내가 분석을 진행할 때 쓰는 코드들이고, 분명한 건 이 글은 내가 데이터분석을 거듭할수록 수정의 여지가 존재하는 것이다. 아는 것보다 알아야 할 것들이 많은 나에겐 공부해야 할 것들이 많은 것은 매 번 분석을 진행하면서 느끼는 부분이다. 1 2 3 4 import pandas as pd import numpy as np import seaborn as sns from scipy import stats cs > 전처리 과정에서 필요한 코드를 미리 가져온다. > 전처리 안에서도 다양한 카테고리들이 존재하지만, 굳이 나누진 않겠다. > 사용목적, 상.. 2022. 12. 17.