Pandas 를 알아봅시다.
먼저 사용하기 위해서는 import pandas 해줍니다.
편하게 사용하기 위해 별칭 pd로 지정을 합니다.
import pandas as pd
판다스의 1차원 데이터는 Series 라고 부릅니다.
Series( data = , index=) 를 통해 생성 가능합니다.
위 사진 처럼 list를 만들었습니다.
groceries 변수에 Series를 만들었습니다.
groceries를 실행하면
eggs 30
apples 6
milk Yes
bread No
으로 출력되는걸 알 수 있습니다.
왼쪽 값은 index , 오른쪽 값은 data를 의미합니다.
다만 여기서 index는 우리가 보기 편한 index 입니다.
컴퓨터는 index를 0부터 시작하지만 우리가 보기는 어렵기 때문에
보기 편하도록 설정한 값입니다.
위 사진처럼 index값이 존재하지 않을 경우 컴퓨터가 인식하는 index 값이 들어오게 됩니다..
index 와 data 값을 출력하기 위해서는 각각 변수.index , 변수.values 로 알 수 있습니다.
1차원인지 확인은 ndim을 이용해 가능하고 크기는 size를 통해 가능하다.
data가 있는지 없는지는 in 키워드를 통해 알 수 있으며
index 값이 있는지 알아보기 위해선 in 변수명
data값이 있는지 알아보기 위해서는 in 변수명.values를 해준다.
data 접근은 엑세스를 통해 원하는 값 출력이 가능합니다.
다만 기존에는 index 값을 숫자로 입력하였으나, pandas는
우리가 설정한 index 값을 입력하여 알 수 있습니다.
다음과 같은 index와 data 값을 가진 fruits가 있습니다.
여기에 data 값들이 전부다 5씩 증가하려면
기존 list 는 data값들을 하나하나 가져와 더해주고 저장하는
방식을 이용했습니다
pandas는 이보다 편리하게 연산을 통해 가능하게 됩니다.
이런 식으로 + 연산뿐만아니라 -,X , / 또한 가능합니다.
'개발 > 파이썬' 카테고리의 다른 글
파이썬. Pandas DataFrame 데이터 수정, 컬럼 추가,행 추가 (0) | 2022.11.24 |
---|---|
파이썬. Pandas Dataframe 생성,접근,NaN (0) | 2022.11.23 |
파이썬. Numpy - random(),randint(),슬라이싱,조건식,copy(),unique() (0) | 2022.11.23 |
파이썬. Numpy - 기본개념, 벡터와 행렬 (0) | 2022.11.22 |
파이썬. 메모리 (0) | 2022.11.22 |