본문 바로가기

분류 전체보기126

[ Pandas ] 시계열 데이터 시계열 데이터로 변경 df['Date'] = pd.to_datetime(df['Date']) s = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023']) df = pd.to_datetime(s, format = '%d-%m-%Y') #입력받은 날짜 데이터 형식을 맞춰줌 시계열 데이터인 인덱스를 활용 # 기본 반환 형태 # Index(['10', '10', '10', '10', ...], dtype='object', name='인덱스명', length=행길이) # .astype(int) 했을 때 # Int64Index([10, 10, 10, 10, 10, ...], dtype='int64', name='인덱스명', length=행길이) df.index.strfti.. 2023. 2. 17.
[Pandas] 연산 방법 정리 데이터 세팅 a1 = [60, 84, 80] a2 = [77, 62, 95] a3 = [61, 97, 72] # 2차원 배열 df_data = [a1, a2, a3] other_data = [[1,10,100],[2,20,200],[3,30,300]] cols = ["국어", "영어", "수학"] rows = ['a','b','c'] df = pd.DataFrame(data=df_data, index=rows, columns=cols) other = pd.DataFrame(data=other_data,index=rows,columns=cols) 연산 메소드 # 왼쪽 -> 오른쪽 더하기 df.add(other, axis='columns', level=None, fill_value=None) # 오른쪽 ->.. 2023. 2. 16.
[Numpy] 연산 방법 정리 ndarray 연산 방법 a = np.arange(1, 10) # [1~9] nparray 형태가 됨 b = np.arange(1, 10) # [1~9] nparray 형태가 됨 ## 이항연산 sum_ = a + b # 각 인덱스 위치별 더하기 적용 print(f'{a}\n{b}\n{sum_}') """ [1 2 3 4 5 6 7 8 9] [1 2 3 4 5 6 7 8 9] [ 2 4 6 8 10 12 14 16 18] """ minus = a - b print(f'{a}\n{b}\n{minus}') """ [1 2 3 4 5 6 7 8 9] [1 2 3 4 5 6 7 8 9] [0 0 0 0 0 0 0 0 0] """ squared = a ** 2 # 배열 제곱 인덱스별 적용 print(a, squar.. 2023. 2. 16.
[Numpy] ndarray 인덱싱, 슬라이싱, 정렬 Normal indexing matrix = np.random.randint(1,10, (4,4)) print(matrix) """ [[4 6 2 6] [2 4 2 6] [7 2 6 1] [8 1 4 1]] """ # 기존 파이썬 인덱싱 방법 print(f'{matrix[0]} {matrix[0][1]}') # [4 6 2 6] 6 # [행, 열] 표기법 print(f'{matrix[1][3]} {matrix[1, 3]}') # 6 6 # [...] 표기법 가능 print(matrix[1:3, 2:5]) print(matrix[1, ...]) print(matrix[1,:]) """ [[2 6] [6 1]] [2 4 2 6] [2 4 2 6] """ Boolean indexing & Fancy index.. 2023. 2. 16.
[Pandas] 데이터 전처리 기초 정리 Pandas 기초는 여기로! [Pandas] - 기초, 인덱싱 라이브러리 불러오기 import pandas as pd 데이터 불러오기 및 저장 # csv 파일 읽기 df = pd.read_csv('./sample1.csv', sep=',', encoding='cp949', na_values=['nan으로 바꿀 특정 값']) # csv 로 파일 저장 pd.to_csv('./filename.csv kyportfolio.tistory.com 데이터 로딩 # csv 파일 받기 """ - 디렉토리위치와 파일명 - sep = 구분자 - index_col = 인덱스 컬럼 - encoding = 인코딩 방식 - header = 컬럼명으로 바꿔줄 행 """ seoul_moving = pd.read_csv('1.2 seo.. 2023. 2. 16.
KT AIVLE School 3주차 정리 - 크롤링 중국 정원사진 모음 사이트와 인스타그램 크롤링 경험으로 사실 크롤링을 배울 땐 다른 학습을 하려고 했었습니다! 하지만 강사님께서 정말 고수의 향기가 느껴지시고, 설명을 잘해주셔서 강의에 집중을 할 때 도 있었습니다! 크롤링을 했던 적이 1년이 넘어가다보니, 1년사이에 웹개발을 해보면서 저의 식견이 넓어진 것이 느껴졌습니다. 분명 강사님께서는 아주 간략하게 설명을 해주시고 빠르게 진도를 나가시지만 저는 그 외의 지식도 점점 더 생기니 풍부하게 이해를 해서 좋은 것 같아요. 역시 공부는 꾸준히 해야하나 봅니다! 프로토콜 : 통신 규약, 약속 ex) udp, http, https 포트번호 : 하나의 서버 안에 데이터가 들어오고 나가는 통로 주소 dns 서버: 아이피 주소 대신으로 나타내주는 것 referer .. 2023. 2. 16.