본문 바로가기

전체 글34

판다스 / pandas 3 - 정렬, 컬럼제거, 데이터 가공, 파생변수 생성 - 데이터 준비 - pandas 정렬 => .sort_values .sort_values(by = '컬럼명', ascending = False or True) customer.sort_values(by = 'is_deleted', ascending = False) # ascending : 오름차순 pandas 컬럼 제거 => drop .drop customer1 = customer.drop(['end_date'], axis = 1) customer1 데이터 가공 => apply - 데이터 준비 - df = pd.DataFrame([ [1,2,3,4], [7,6,9,2] ]) df def cal(col): return col.max()- col.min() df.apply(cal) # col에는 컬럼별로 배.. 2021. 8. 6.

판다스 / pandas 2 - 데이터 추출(인덱싱, 슬라이싱, loc, iloc, 불리언 인덱싱) - 데이터 준비- panadas 인덱싱 - 차원축소가 일어납니다. - 수직 방향, 컬럼 단위로 데이터를 추출합니다. customer['customer_id'] customer[['customer_id', 'name']].tail(2) # 차원을 유지하고 싶을 때 []로 더 감싸주면 됩니다. pandas 슬라이싱 - 차원이 유지됩니다. - 수평 방향, 인덱스(row) 단위로 데이터를 추출합니다. customer[1:4] => 인덱스의 순서를 사용한 경우 # 인덱스의 순서를 사용하면 a 2021. 8. 5.

판다스 / pandas 1 - 기본생성, 외부에서 데이터 호출, 데이터 기본 점검 pandas 기본 모듈 가져오기 import pandas as pd import numpy as np pandas 기본 생성 => series series : 데이터(필수, 배열) + 인덱스 정보(옵션), 1차원, 인덱스는 자동적으로 부여됩니다. # np.nan : 결측 데이터 a = pd.Series([1,2,3,np.nan, 6, 8]) a pandas 기본 생성 => Data Frame Data Frame : 데이터(필수, 배열) + 인덱스 정보(옵션) + 컬럼(옵션), 2차원, 여러개의 series입니다, 인덱싱하면 series가 됩니다. # 데이터 준비 data = np.arange(28).reshape(7,4) # 인덱스 -> 가로기준 -> row:7 index = pd.date_range('.. 2021. 8. 4.

넘파이 / numpy 5 - 선형대수, 저장 및 로드, 압축 - 데이터 준비 - x = np.array([ [1,2,3], [4,5,6] ]) y = np.array([ [6,11], [-1,9], [8,2] ]) x, y numpy 선형대수 - dot(내적곱), matmul(행렬곱) np.dot(x, y) = x.dot(y) : 내적곱을 계산합니다. np.matmul(x, y) : 행렬곱을 계산합니다. numpy 저장 및 로드 np.save('파일명', 배열) : 배열을 저장할 수 있습니다. 1. np.save('x', x) 로 x 배열을 x의 이름으로 저장합니다. 2. 작업하고 있는 폴더에 x.npy 파일이 생성됩니다. np.load('파일명') : 저장된 배열을 불러올 수 있습니다. x1 = np.load('x.npy') x1 numpy 배열 압축 np.sa.. 2021. 8. 4.

이전 1 ··· 3 4 5 6 7 8 9 다음

티스토리툴바