Data Analysis & EDA

원하는 컬럼(들)만 추출하기 (feat. sns)

심전코 2022. 4. 13. 17:54

 

이번엔 데이터셋을 불러온 뒤

데이터프레임에서 원하는 컬럼(들) 만 추출해보자.

 

데이터셋 불러오기

오늘은 Pandas 환경이 아닌

Seaborn 에서 제공하는 샘플 데이터셋인 'Penguins' 데이터를 사용 해 보자.

 

import seaborn as sns
data = sns.load_dataset('penguins')

먼저, 코랩에 seaborn 을 임포트 시켜주고 데이터셋을 불러온다.

불러온 데이터셋은 data 라는 변수에 담아주었다.

 

아래 Shape 을 확인 해 보면 (344, 7) 의 형태임을 확인 할 수 있다.

 

 

원하는 컬럼 추출

이 데이터프레임에서 

bill_length_mm, bill_depth_mm, flipper_length_mm, body_mass_g 컬럼 만 추출 해 보자.

data1 = data[['bill_length_mm','bill_depth_mm','flipper_length_mm','body_mass_g']]

추출한 값을 data1 이라는 변수에 담아주었다.

 

지정한 컬럼들만 추출이 되었고,

Shape 이 (344, 4) 로 변경된 것을 확인 할 수있다.