본문 바로가기

pandas5

[Pandas] index 활용 정리 멀티 컬럼, 멀티 인덱스 등 바로 사용하기엔 괴이한? 인구 데이터를 보기도 했었고, 에이블스쿨에서 실습했었던 데이터에도 index를 활용해서 전처리를 하는 예제가 있어서 정리를 해보려한다! 인덱스의 컬럼명 설정 df.set_index('인덱스컬럼명', inplace=True) 인덱스 변경 df.set_index('기존에 있는 컬럼명', inplace=True, append=False, drop=True) drop: 기존 인덱스 값들을 제거할지 말지 설정 append: 기존 인덱스를 유지하고 인덱스를 추가할지 말지 설정 멀티 인덱스를 하려면 리스트로 감쌀 것 인덱스 초기화 df.reset_index(drop=False, inplace=False) 전처리 과정에서 행을 제거한 경우 다시 index를 설정 d.. 2023. 3. 6.
[ Pandas ] 시계열 데이터 시계열 데이터로 변경 df['Date'] = pd.to_datetime(df['Date']) s = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023']) df = pd.to_datetime(s, format = '%d-%m-%Y') #입력받은 날짜 데이터 형식을 맞춰줌 시계열 데이터인 인덱스를 활용 # 기본 반환 형태 # Index(['10', '10', '10', '10', ...], dtype='object', name='인덱스명', length=행길이) # .astype(int) 했을 때 # Int64Index([10, 10, 10, 10, 10, ...], dtype='int64', name='인덱스명', length=행길이) df.index.strfti.. 2023. 2. 17.
[Pandas] 연산 방법 정리 데이터 세팅 a1 = [60, 84, 80] a2 = [77, 62, 95] a3 = [61, 97, 72] # 2차원 배열 df_data = [a1, a2, a3] other_data = [[1,10,100],[2,20,200],[3,30,300]] cols = ["국어", "영어", "수학"] rows = ['a','b','c'] df = pd.DataFrame(data=df_data, index=rows, columns=cols) other = pd.DataFrame(data=other_data,index=rows,columns=cols) 연산 메소드 # 왼쪽 -> 오른쪽 더하기 df.add(other, axis='columns', level=None, fill_value=None) # 오른쪽 ->.. 2023. 2. 16.
[Pandas] 데이터 전처리 기초 정리 Pandas 기초는 여기로! [Pandas] - 기초, 인덱싱 라이브러리 불러오기 import pandas as pd 데이터 불러오기 및 저장 # csv 파일 읽기 df = pd.read_csv('./sample1.csv', sep=',', encoding='cp949', na_values=['nan으로 바꿀 특정 값']) # csv 로 파일 저장 pd.to_csv('./filename.csv kyportfolio.tistory.com 데이터 로딩 # csv 파일 받기 """ - 디렉토리위치와 파일명 - sep = 구분자 - index_col = 인덱스 컬럼 - encoding = 인코딩 방식 - header = 컬럼명으로 바꿔줄 행 """ seoul_moving = pd.read_csv('1.2 seo.. 2023. 2. 16.
[Pandas] - 기초, 인덱싱 라이브러리 불러오기 import pandas as pd 데이터 불러오기 및 저장 # 시리즈 생성 # pd.Series(data = array) data = [1,2,3,4,5] s = pd.Series(data = data) # 데이터프레임 생성 # pd.DataFrame(data = array, columns = ['열1', '열2', ...], index = ['인덱스1', '인덱스2' ...]) # pd.DataFrame(dictionary) data = {'column_1': [1,2,3,4,5], 'column_2': ['김', '이', '박', '최', '고']} df = pd.DataFrame(data) # csv 파일 읽기 df = pd.read_csv('./sample1.csv', sep.. 2023. 2. 15.