Data Analysis & EDA

원하는 행 지우기 (.drop 컬럼명)

심전코 2022. 4. 28. 02:46

 

앞선 포스팅에서 .drop 메소드를 이용해 행을 지우는 실습을 해 보았다.

df1.drop(df1.index[0])

위와 같은 형태로 인덱스 번호를 지정해 행을 삭제하는 방법을 사용했는데,

 

이번엔 조금 더 직관적으로

제거하고 싶은 컬럼명을 지정해 제거하는 방법에 대해 알아보도록 하자.

 

 

df.head()

변경 전

데이터프레임에서 .head() 메소드를 사용해 5개의 행 만을 뽑아왔다.

숫자형으로 이루어진 데이터프레임에서 문자로 이루어진 diagnosis 컬럼을 제거 해 보도록 하자.

 

df = df.drop(['diagnosis'], axis=1)
df.head()

말 그대로 .drop 메소드를 사용하는데 그 안에 컬럼명만 지정 해 주면 된다.

매개변수인 axis=1 의 의미는 컬럼(열)을 지칭하며,

axis=0 은 인덱스(행)을 의미한다.

 

위 코드는 원하는 컬럼을 제거 한 뒤 원본데이터인 df 에 저장을 해 준 것이다.

이 방법이 아닌, 원본 데이터에 변경된 값을 저장하려면 inplace 옵션을 지정 해 주면 된다.

inplace=True 를 사용하면,변경된 데이터를 원본데이터로 대체하겠다는 의미이며반대로 False(inplace 의 default 값) 를 사용하면,변경된 데이터를 출력하지만 원본데이터에는 영향을 끼치지 않는다.

 

변경 후