라이브러리 불러오기
import pandas as pd
데이터 불러오기 및 저장
data = [1,2,3,4,5]
s = pd.Series(data = data)
data = {'column_1': [1,2,3,4,5], 'column_2': ['김', '이', '박', '최', '고']}
df = pd.DataFrame(data)
df = pd.read_csv('./sample1.csv', sep=',', encoding='cp949', na_values=['nan으로 바꿀 특정 값'])
pd.to_csv('./filename.csv', as_index=False, encoding='utf-8', na_rep='nan을 변환해줄 문자열', header=boolean)
시리즈, 데이터프레임 생성
index = [1,2,3,4,5]
data = ['수학', '과학', '영어', '지리', '과학']
s1 = pd.Series(data = data, index=index)
s2 = pd.Series(range(3), index=["a", "b", "c"])
s3 = pd.Series({1: '수학', 2: '과학', 3: '영어', 4: '지리', 5: '과학'})
s4 = pd.Series({1: '수학', 2: '과학', 3: '영어', 4: '지리', 5: '과학'} index=index)
data = [['수학','과학','영어','지리','과학'], [90, 50, 80, 60, 70]]
index = [0, 1, 2, 3, 4]
columns = ['과목', '점수']
df1 = pd.DataFrame(data = data, columns = ['컬럼명1'], index = [0,1,2,3,4], columns=columns)
dict_data = {
'과목': ['수학', '과학', '영어', '지리', '과학'],
'점수': [90, 50, 80, 60, 70]
}
df2 = pd.DataFrame(dict_data)
시리즈와 데이터프레임 메소드 정리
ds.values
ds.name
ds.index
ds.index.name
ds.notnull()
df.values
df.index
df.columns # = list(df)
df.index.name
df.columns.name
df.T
df.info()
df.describe()
인덱싱
df[1:3]
df[1:3][2]
df['컬럼명1', '컬럼명2']
df.loc[ 조건 , '컬러명2']
df.loc[ 조건 , ['컬럼명1', '컬럼명2']]
df.iloc[]
df.loc[df['temperature'] >= 15]
def hot_days(df):
return df['temperature'] > 25
df.loc[hot_days(df)]
df.loc[['temperature']]
df.loc[(df['age'] >= 10]) & (df['age'] <= 19)]
댓글