Data Analysis & EDA

데이터프레임의 열 이름 / 컬럼명 변경하기 (.rename)

심전코 2022. 4. 14. 01:50

 

데이터셋 준비하기

데이터셋을 불러오는 과정이 햇갈린다면 아래 글을 참고하기 바란다.

https://battlecoding.tistory.com/10

 

데이터셋 불러오기 (cvs, xlsx 등)

데이터 분야를 공부한다면 제일 처음 해야하는게 데이터를 불러오는게 아닐까 생각된다. 뭐가 있어야 이래저래 갖고놀지.. 개발환경 실습에 앞서 개발환경은 구글 코랩을 사용한다. - 코랩이란?

battlecoding.tistory.com

 

url = ('https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv')
df = pd.read_csv(url)

url 에 담긴 데이터의 원본은 네이버 금융을 통해서 확인할 수 있다.

 

 

데이터프레임 위에 컬럼이 있는데 현재 컬럼들이 숫자형 값으로 지정되어있다.

실습을 진행중임으로 과감히 버리겠다.

 

맨 앞의 데이터 일부만을 추출해서 진행하겠다.

추출하는과정을 까먹었다면 아래 링크에서 확인할 수 있다.

https://battlecoding.tistory.com/18

 

원하는 컬럼(들)만 추출하기 (feat. sns)

이번엔 데이터셋을 불러온 뒤 데이터프레임에서 원하는 컬럼(들) 만 추출해보자. 데이터셋 불러오기 오늘은 Pandas 환경이 아닌 Seaborn 에서 제공하는 샘플 데이터셋인 'Penguins' 데이터를 사용 해

battlecoding.tistory.com

df = df[['19/6','12,578','3,991']]

변경 전

추출한 데이터의 컬럼 '19/6', '12,578', '3,991' 을 보기 좋게 바꿔야할듯싶다.

 

열 이름 / 컬럼명 변경하기

df.columns = ['년/월', '합격자 수', '불합격자 수']

변경 후

.columns 는 전체 데이터의 컬럼을 변경할 때 사용한다.

위 같은 경우는 데이터의 양이 소량이기에 .columns 를 사용했지만

 

선택하여 원하는 컬럼의 이름만도 변경할 수 있다.

df.rename(columns={'Before':'After'})

Before 부분에 변경 전의 컬럼명을

After 부분에 변경하고자 하는 컬럼명을 넣어주면 가능하다.