Data Analysis & EDA

데이터프레임 합치기 (.merge)

심전코 2022. 4. 15. 02:13

 

데이터프레임 생성

임의의 두 데이터프레임을 생성해주겠다.

df = pd.DataFrame({'Test':[1, 2, 3],
                    'Test1':['4', '5', '6'],
                    'Test2':['7', '8', '9']})
df1 = pd.DataFrame({'Test':[1, 2, 3],
                    'Test3':['10', '11', '12'],
                    'Test4':['13', '14', '15']})

조건으로는

두 변수에 담긴 데이터프레임의 첫번째 행의 값이 같게 만들어 주었다.

 

데이터프레임 합치기

임의로 생성한 두개의 데이터프레임을 merge 를 이용해 합쳐보자.

merge는 concat과 다르게 공통된 부분을 기반으로 합치기가 주된 용도이다.

df = df.merge(df1, how = 'inner', on = 'Test')

merge 함수를 사용하는 방법으로는 아래와 같다. (기준 feature == 컬럼명)

df.merge("붙일 내용", how = "(방법)", on ="(기준 feature)")

 

이 외에도 how (방법) 에는 다양한 메소드가 존재한다.

outer

left

right..

결과는 실습으로 맡기겠다.