DataFrame 은 CSV 파일 을 읽어와 사용하게 됩니다.
import pandas as pd
pd.read_csv('경로/파일명.csv')
위와같은 방식으로 읽어오게 됩니다.
예를 들어 winemag-data_first150k 라는 이름의 csv 파일이 있고 이를
reviews 라는 변수에 가져와보겠습니다.
reviews = pd.read_csv('../data/winemag-data_first150k.csv',index_col=0)
여기서 index_col 은 가져온 데이터프레임에 컬럼을 인덱스로 사용하겠다는 의미로 0은 첫번째 값을
인덱스로 사용한다 는 의미입니다.
이런 형태의 수만가지 데이터가 저장됩니다.
처음 몇개의 형태만 출력하고 싶다면 head()를 , 뒤에 몇개를 출력하고 싶다면
tail()을 이용하면 됩니다.
통계치를 알고 싶다면 describe()를 이용합니다.
reviews.describe()
제가 가져온 값에는 이러한 통계가 잡히게 됩니다.
또한 앞선 info() 함수 또한 이용이 가능합니다.
'개발 > 파이썬' 카테고리의 다른 글
파이썬. DataFrame Categorical Data (0) | 2022.11.25 |
---|---|
파이썬. Pandas NaN값 처리하기 (0) | 2022.11.24 |
파이썬.Pandas DataFrame 행,열 삭제하기,인덱스설정,이름변경 (0) | 2022.11.24 |
파이썬. Pandas DataFrame 데이터 수정, 컬럼 추가,행 추가 (0) | 2022.11.24 |
파이썬. Pandas Dataframe 생성,접근,NaN (0) | 2022.11.23 |