개발/파이썬

파이썬. DataFrame 합치기

웅'jk 2022. 11. 25. 16:38

예전에 DataFrame 에 행을 추가하는 함수로 append를 사용했는데 

파이썬에서는 concat을 이용하라고 했었습니다.

 

컬럼의 이름이 같으면,

pd.concat(  [DataFrame1, DataFrame2, ····] ) 이런식으로 추가가 가능합니다.

 

df1

 

df2
df3
pd.concat( [ df1, df2, df3 ] )

이번에는 컬럼의 일부분이 같은 데이터프레임들을 합쳐봅시다.

df_Engineering_dept
df_Finance_dept

위 두가지는 컬럼이 같은 데이터프레임이라 concat으로 합치는게 가능합니다.

df_salary

위 데이터프레임은 앞선 것들과 Employee ID라는 컬럼만 같을 뿐

다른 데이터프레임 입니다 하나로 합쳐서 새로운 컬럼이 추가된 데이터 프레임을 

만들어 봅시다.

 

이때는 merge라는 함수를 이용합니다.

pd.merge('데이터프레임1','데이터프레임2', on = '공통된컬럼' , how= '')

pd.merge(df_all, df_salary, on= 'Employee ID', how= 'left')

how 에 속성값은 left, right 등이 있으며 두 컬럼 중 같지 않은 값을 처리할지 여부를 

정하는 속성이다.