판다스 / pandas 3 - 정렬, 컬럼제거, 데이터 가공, 파생변수 생성
- 데이터 준비 - pandas 정렬 => .sort_values .sort_values(by = '컬럼명', ascending = False or True) customer.sort_values(by = 'is_deleted', ascending = False) # ascending : 오름차순 pandas 컬럼 제거 => drop .drop customer1 = customer.drop(['end_date'], axis = 1) customer1 데이터 가공 => apply - 데이터 준비 - df = pd.DataFrame([ [1,2,3,4], [7,6,9,2] ]) df def cal(col): return col.max()- col.min() df.apply(cal) # col에는 컬럼별로 배..
2021. 8. 6.
판다스 / pandas 1 - 기본생성, 외부에서 데이터 호출, 데이터 기본 점검
pandas 기본 모듈 가져오기 import pandas as pd import numpy as np pandas 기본 생성 => series series : 데이터(필수, 배열) + 인덱스 정보(옵션), 1차원, 인덱스는 자동적으로 부여됩니다. # np.nan : 결측 데이터 a = pd.Series([1,2,3,np.nan, 6, 8]) a pandas 기본 생성 => Data Frame Data Frame : 데이터(필수, 배열) + 인덱스 정보(옵션) + 컬럼(옵션), 2차원, 여러개의 series입니다, 인덱싱하면 series가 됩니다. # 데이터 준비 data = np.arange(28).reshape(7,4) # 인덱스 -> 가로기준 -> row:7 index = pd.date_range('..
2021. 8. 4.
넘파이 / numpy 5 - 선형대수, 저장 및 로드, 압축
- 데이터 준비 - x = np.array([ [1,2,3], [4,5,6] ]) y = np.array([ [6,11], [-1,9], [8,2] ]) x, y numpy 선형대수 - dot(내적곱), matmul(행렬곱) np.dot(x, y) = x.dot(y) : 내적곱을 계산합니다. np.matmul(x, y) : 행렬곱을 계산합니다. numpy 저장 및 로드 np.save('파일명', 배열) : 배열을 저장할 수 있습니다. 1. np.save('x', x) 로 x 배열을 x의 이름으로 저장합니다. 2. 작업하고 있는 폴더에 x.npy 파일이 생성됩니다. np.load('파일명') : 저장된 배열을 불러올 수 있습니다. x1 = np.load('x.npy') x1 numpy 배열 압축 np.sa..
2021. 8. 4.