Data Analysis & EDA
원하는 컬럼(들)만 추출하기 (feat. sns)
심전코
2022. 4. 13. 17:54
이번엔 데이터셋을 불러온 뒤
데이터프레임에서 원하는 컬럼(들) 만 추출해보자.
데이터셋 불러오기
오늘은 Pandas 환경이 아닌
Seaborn 에서 제공하는 샘플 데이터셋인 'Penguins' 데이터를 사용 해 보자.
import seaborn as sns
data = sns.load_dataset('penguins')
먼저, 코랩에 seaborn 을 임포트 시켜주고 데이터셋을 불러온다.
불러온 데이터셋은 data 라는 변수에 담아주었다.

아래 Shape 을 확인 해 보면 (344, 7) 의 형태임을 확인 할 수 있다.
원하는 컬럼 추출
이 데이터프레임에서
bill_length_mm, bill_depth_mm, flipper_length_mm, body_mass_g 컬럼 만 추출 해 보자.
data1 = data[['bill_length_mm','bill_depth_mm','flipper_length_mm','body_mass_g']]
추출한 값을 data1 이라는 변수에 담아주었다.

지정한 컬럼들만 추출이 되었고,
Shape 이 (344, 4) 로 변경된 것을 확인 할 수있다.