Data Analysis & EDA

데이터프레임 타입 변경하기 (.astype)

심전코 2022. 4. 15. 00:59

 

데이터셋 불러오기

이전 데이터를 이어서 사용하겠다.

이번 실습에서의 차이는 데이터를 불러올때 천 단위의 숫자에 있는 ' , ' (콤마) 를 제거 하고 불러오는 것이다.

import pandas as pd
url = ('https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv')
df = pd.read_csv(url)

메소드 적용 전

import pandas as pd
url = ('https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv')
df = pd.read_csv(url, thousands = ',')

메소드 적용 후

 

숫자로 이루어진 데이터의 컬럼만 추출하고, 컬럼명까지 바꾸어보자.

df = df[['12,578','3,991']]
df.columns = ['합격자 수', '불합격자 수']

변경 전

 

추출한데이터의 타입을 확인해보자.

df.dtypes

변경 전

 

astype 으로 데이터 형 변환하기

데이터타입이 'int' 인 '합격자 수' 컬럼을

실수형 타입인 'float' 로 변환 해 보자. 

df['합격자 수'] = df['합격자 수'].astype(float)
df.dtypes

변경 후

 

실수형 타입으로 변환된 데이터를 확인할 수 있다. (소숫점)

변경 후

완벽했다.