KT AIVLE School 2주차 정리 - 데이터 분석
데이터 분석의 과정 CRISP-DM 비즈니스 이해와 데이터 이해 현황, 문제, 배경 조사 EDA, CDA 가설 설정 데이터 전처리 데이터 분석 (환경설정 - 가설 설정 - 단변량, 이변량 분석 - 가설 검정) 가설 검정 (단변량, 이변량 분석) 숫자-숫자: scatterplot, pairplot, / spst.pearsonr(상관분석), df.corr(), sns.heatmap() 숫자-범주: kdeplot, boxplot, desityplot, countplot / ? 범주-숫자: 평균비교 barplot / t-test(t-검정), ANOVA(분산분석) 범주-범주: sns.barplot, Mosaic, pd.crosstab, plt.axhline, plt.axvline / spst.chi2_contin..
2023. 2. 15.