개발/파이썬

파이썬. Pandas 생성, 접근,연산

웅'jk 2022. 11. 23. 16:10

Pandas 를 알아봅시다.

 

먼저 사용하기 위해서는 import pandas 해줍니다. 

편하게 사용하기 위해 별칭 pd로 지정을 합니다.

 

import pandas as pd

 

판다스의 1차원 데이터는 Series 라고 부릅니다.

Series( data = , index=) 를 통해 생성 가능합니다.

위 사진 처럼 list를 만들었습니다.

groceries 변수에 Series를 만들었습니다.

groceries를 실행하면 

eggs 30

apples 6

milk Yes

bread No

으로 출력되는걸 알 수 있습니다.

왼쪽 값은 index , 오른쪽 값은 data를 의미합니다.

 

다만 여기서 index는 우리가 보기 편한 index 입니다.

컴퓨터는 index를 0부터 시작하지만 우리가 보기는 어렵기 때문에

보기 편하도록 설정한 값입니다. 

위 사진처럼 index값이 존재하지 않을 경우 컴퓨터가 인식하는 index 값이 들어오게 됩니다..

index 와 data 값을 출력하기 위해서는 각각 변수.index , 변수.values 로 알 수 있습니다.

1차원인지 확인은 ndim을 이용해 가능하고 크기는 size를 통해 가능하다.

data가 있는지 없는지는 in 키워드를 통해 알 수 있으며

index 값이 있는지 알아보기 위해선 in 변수명

data값이 있는지 알아보기 위해서는 in 변수명.values를 해준다.

 

data 접근은 엑세스를 통해 원하는 값 출력이 가능합니다.

다만 기존에는 index 값을 숫자로 입력하였으나, pandas는 

우리가 설정한 index 값을 입력하여 알 수 있습니다.

 

다음과 같은 index와 data 값을 가진 fruits가 있습니다.

여기에 data 값들이 전부다 5씩 증가하려면 

기존 list 는 data값들을 하나하나 가져와 더해주고 저장하는

방식을 이용했습니다

pandas는 이보다 편리하게 연산을 통해 가능하게 됩니다.

이런 식으로 + 연산뿐만아니라 -,X , / 또한 가능합니다.