[ Pandas ] 시계열 데이터
시계열 데이터로 변경 df['Date'] = pd.to_datetime(df['Date']) s = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023']) df = pd.to_datetime(s, format = '%d-%m-%Y') #입력받은 날짜 데이터 형식을 맞춰줌 시계열 데이터인 인덱스를 활용 # 기본 반환 형태 # Index(['10', '10', '10', '10', ...], dtype='object', name='인덱스명', length=행길이) # .astype(int) 했을 때 # Int64Index([10, 10, 10, 10, 10, ...], dtype='int64', name='인덱스명', length=행길이) df.index.strfti..
2023. 2. 17.
[Pandas] 연산 방법 정리
데이터 세팅 a1 = [60, 84, 80] a2 = [77, 62, 95] a3 = [61, 97, 72] # 2차원 배열 df_data = [a1, a2, a3] other_data = [[1,10,100],[2,20,200],[3,30,300]] cols = ["국어", "영어", "수학"] rows = ['a','b','c'] df = pd.DataFrame(data=df_data, index=rows, columns=cols) other = pd.DataFrame(data=other_data,index=rows,columns=cols) 연산 메소드 # 왼쪽 -> 오른쪽 더하기 df.add(other, axis='columns', level=None, fill_value=None) # 오른쪽 ->..
2023. 2. 16.
[Pandas] - 기초, 인덱싱
라이브러리 불러오기 import pandas as pd 데이터 불러오기 및 저장 # 시리즈 생성 # pd.Series(data = array) data = [1,2,3,4,5] s = pd.Series(data = data) # 데이터프레임 생성 # pd.DataFrame(data = array, columns = ['열1', '열2', ...], index = ['인덱스1', '인덱스2' ...]) # pd.DataFrame(dictionary) data = {'column_1': [1,2,3,4,5], 'column_2': ['김', '이', '박', '최', '고']} df = pd.DataFrame(data) # csv 파일 읽기 df = pd.read_csv('./sample1.csv', sep..
2023. 2. 15.