Data Analysis & EDA
데이터프레임 타입 변경하기 (.astype)
심전코
2022. 4. 15. 00:59
데이터셋 불러오기
이전 데이터를 이어서 사용하겠다.
이번 실습에서의 차이는 데이터를 불러올때 천 단위의 숫자에 있는 ' , ' (콤마) 를 제거 하고 불러오는 것이다.
import pandas as pd
url = ('https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv')
df = pd.read_csv(url)

import pandas as pd
url = ('https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv')
df = pd.read_csv(url, thousands = ',')

숫자로 이루어진 데이터의 컬럼만 추출하고, 컬럼명까지 바꾸어보자.
df = df[['12,578','3,991']]
df.columns = ['합격자 수', '불합격자 수']

추출한데이터의 타입을 확인해보자.
df.dtypes

astype 으로 데이터 형 변환하기
데이터타입이 'int' 인 '합격자 수' 컬럼을
실수형 타입인 'float' 로 변환 해 보자.
df['합격자 수'] = df['합격자 수'].astype(float)
df.dtypes

실수형 타입으로 변환된 데이터를 확인할 수 있다. (소숫점)

완벽했다.