본문 바로가기
반응형

scikit-learn2

[Scikit-learn] pipeline 이해하기 인터넷에서 코드를 뒤져가며 공부를 하다보니 어떻게하면 효율적인 코드를 짤 지, 직관적이며 유지관리보수가 편한 코드가 무엇일 지 궁금증에 찾아봤습니다. 이걸 찾아본 이유는 KT AIVLE School 에서는 변수선택, 스케일링, 원핫인코딩, 전처리 등의 과정을 계속해서 반복하는 것이 학습에는 매우 좋았으나 코드를 유지보수하는 측면에서는 너무 답답했습니다.. ㅠㅠ 그래서 Pipeline에 대해서 공부를 했습니다! PipeLine 사용해보기 from sklearn.pipeline import Pipeline from lightgbm import LGBMClassifier as LGBMC pipe = Pipeline([ ('Feature_Selection', SelectKBest(f_classif, k=2)),.. 2023. 3. 9.
[scikit-learn] KFold 와 StratifiedKFold 의 차이 크게 중요하지는 않지만 알아두면 좋을 것 같아서 글을 적어둡니다! 인터넷에 널린 코드들을 보다보니 StratifiedKFold 라는 함수가 보여서 AIVLE School 에서 배우지 않았던 개념이었습니다! KFold 회귀 문제(회귀의 결정값은 연속된 숫자값이기 때문에 결정값 별로 분포를 정하는 의미가 없기 때문 StratifedKFold 레이블 데이터가 왜곡됬을 경우 반드시. 일반적으로 분류에서의 교차 검증 참고: https://velog.io/@ohxhxs/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EA%B5%90%EC%B0%A8%EA%B2%80%EC%A6%9D-KFold-StratifiedKFold-crossvalscoreGr.. 2023. 3. 9.
반응형