멀티 컬럼, 멀티 인덱스 등 바로 사용하기엔 괴이한? 인구 데이터를 보기도 했었고, 에이블스쿨에서 실습했었던 데이터에도 index를 활용해서 전처리를 하는 예제가 있어서 정리를 해보려한다!
인덱스의 컬럼명 설정
df.set_index('인덱스컬럼명', inplace=True)
인덱스 변경
df.set_index('기존에 있는 컬럼명', inplace=True, append=False, drop=True)
- drop: 기존 인덱스 값들을 제거할지 말지 설정
- append: 기존 인덱스를 유지하고 인덱스를 추가할지 말지 설정
- 멀티 인덱스를 하려면 리스트로 감쌀 것
인덱스 초기화
df.reset_index(drop=False, inplace=False)
- 전처리 과정에서 행을 제거한 경우 다시 index를 설정
- drop: set_index 메소드와 동일
새로운 인덱스 설정
df.index = new_index_list
- df의 행 수 만큼의 리스트를 df.index에 할당하여 인덱스 설정
df.index
를 출력하면 해당 인덱스 값들 전부 출력
인덱스 컬럼명 부여
df.index.name = new_index_name
인덱스 정렬
df.sort_index(ascending=True, inplace=True)
- 피봇테이블, 멀티 인덱스 등이 정렬이 안되어있을 때 사용
'AI > - Library' 카테고리의 다른 글
[HyperOpt] 베이지안 최적화 알아보기 (0) | 2023.03.09 |
---|---|
[Scikit-learn] pipeline 이해하기 (0) | 2023.03.09 |
[scikit-learn] KFold 와 StratifiedKFold 의 차이 (0) | 2023.03.09 |
[lightGBM] 파라미터, 메소드, 어트리뷰트 파헤치기 (0) | 2023.03.03 |
[PyTorch] 기본 알아둘 것 정리 (0) | 2023.03.03 |
[ Pandas ] 시계열 데이터 (0) | 2023.02.17 |
댓글