본문 바로가기

AI/- Library14

[PyTorch] 기본 알아둘 것 정리 01. 데이터 생성 및 확인 스칼라 : 하나의 숫자 벡터 : 숫자와 방향 행렬 : 2차워 숫자 배열 텐서 : n-차원 숫자 배열 # 스칼라 생성 scalar = torch.tensor(7) # 스칼라의 값 확인 print(scalar.item()) # 벡터 생성 tensor = torch.tensor([3, 4]) tensor_ex = torch.tensor([3.0, 6.0, 9.0], dtype=None, # 텐서의 타입 설정 ( 데이터의 정확도 표현 ) device=None, # cpu와 cuda 설정 가능 / 다른 device끼리 연산하면 에러 발생 requires_grad=False) # gradient를 추적 설정 print(tensor) tensor.shape # 텐서의 사이즈 tensor... 2023. 3. 3.
[ Pandas ] 시계열 데이터 시계열 데이터로 변경 df['Date'] = pd.to_datetime(df['Date']) s = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023']) df = pd.to_datetime(s, format = '%d-%m-%Y') #입력받은 날짜 데이터 형식을 맞춰줌 시계열 데이터인 인덱스를 활용 # 기본 반환 형태 # Index(['10', '10', '10', '10', ...], dtype='object', name='인덱스명', length=행길이) # .astype(int) 했을 때 # Int64Index([10, 10, 10, 10, 10, ...], dtype='int64', name='인덱스명', length=행길이) df.index.strfti.. 2023. 2. 17.
[Pandas] 연산 방법 정리 데이터 세팅 a1 = [60, 84, 80] a2 = [77, 62, 95] a3 = [61, 97, 72] # 2차원 배열 df_data = [a1, a2, a3] other_data = [[1,10,100],[2,20,200],[3,30,300]] cols = ["국어", "영어", "수학"] rows = ['a','b','c'] df = pd.DataFrame(data=df_data, index=rows, columns=cols) other = pd.DataFrame(data=other_data,index=rows,columns=cols) 연산 메소드 # 왼쪽 -> 오른쪽 더하기 df.add(other, axis='columns', level=None, fill_value=None) # 오른쪽 ->.. 2023. 2. 16.
[Numpy] 연산 방법 정리 ndarray 연산 방법 a = np.arange(1, 10) # [1~9] nparray 형태가 됨 b = np.arange(1, 10) # [1~9] nparray 형태가 됨 ## 이항연산 sum_ = a + b # 각 인덱스 위치별 더하기 적용 print(f'{a}\n{b}\n{sum_}') """ [1 2 3 4 5 6 7 8 9] [1 2 3 4 5 6 7 8 9] [ 2 4 6 8 10 12 14 16 18] """ minus = a - b print(f'{a}\n{b}\n{minus}') """ [1 2 3 4 5 6 7 8 9] [1 2 3 4 5 6 7 8 9] [0 0 0 0 0 0 0 0 0] """ squared = a ** 2 # 배열 제곱 인덱스별 적용 print(a, squar.. 2023. 2. 16.
[Numpy] ndarray 인덱싱, 슬라이싱, 정렬 Normal indexing matrix = np.random.randint(1,10, (4,4)) print(matrix) """ [[4 6 2 6] [2 4 2 6] [7 2 6 1] [8 1 4 1]] """ # 기존 파이썬 인덱싱 방법 print(f'{matrix[0]} {matrix[0][1]}') # [4 6 2 6] 6 # [행, 열] 표기법 print(f'{matrix[1][3]} {matrix[1, 3]}') # 6 6 # [...] 표기법 가능 print(matrix[1:3, 2:5]) print(matrix[1, ...]) print(matrix[1,:]) """ [[2 6] [6 1]] [2 4 2 6] [2 4 2 6] """ Boolean indexing & Fancy index.. 2023. 2. 16.
[Pandas] 데이터 전처리 기초 정리 Pandas 기초는 여기로! [Pandas] - 기초, 인덱싱 라이브러리 불러오기 import pandas as pd 데이터 불러오기 및 저장 # csv 파일 읽기 df = pd.read_csv('./sample1.csv', sep=',', encoding='cp949', na_values=['nan으로 바꿀 특정 값']) # csv 로 파일 저장 pd.to_csv('./filename.csv kyportfolio.tistory.com 데이터 로딩 # csv 파일 받기 """ - 디렉토리위치와 파일명 - sep = 구분자 - index_col = 인덱스 컬럼 - encoding = 인코딩 방식 - header = 컬럼명으로 바꿔줄 행 """ seoul_moving = pd.read_csv('1.2 seo.. 2023. 2. 16.