개발/파이썬

파이썬. DataFrame 의 Data를 슬라이싱, list로 바꾸기, pivot_table

웅'jk 2022. 11. 30. 10:06

Dataframe의 문자열 데이터를 가져왔을 때 이 문자열을 슬라이싱하고 싶다면 

.str 로 가능하게 됩니다.

 

위와 같은 데이터프레임이 있습니다.

 

관서명을 앞에는 서울 뒤에 서는 경찰서로 바꾸고 싶습니다.

names = '서울' + df['관서명'].str[:-1]+'경찰서'

방법은 여러가지 있으나 간단하게 마지막글자를 제외하고 가져와 뒤에 붙혀주는 방법을 이용했습니다.

이때 슬라이싱을 하기위해 문자열 str 을 가져와 이용합니다.

 

.str 은 str의 함수들을 사용할 수 있게 합니다.

 

이렇게 가져온 데이터들은 Series 데이터 입니다. 이를 리스트로 바꾸고 싶다면

앞선 포스팅에서는 dataframe으로 만드는 방법 to_frame 을 이용했습니다.

 

이번에는 to_list로 만들면 됩니다.

 

names.to_list()

 

pivot_table 은

컬럼의 값을 인덱스로 만들고 그 데이터값으로는 유니크한 값이 오도록 하는 테이블이다.

# data read
df = pd.read_excel('../data/sales-funnel.xlsx')

# create table
pd.pivot_table( df, index=['Name'],aggfunc= )
# index 값으로는 유니크하게 만들고 싶은 컬럼을 적는다.
# aggfunc=에는 이값들을 더할지(sum),평균을 구할지 (mean)등듣 함수를 넣어준다.