개발/파이썬

파이썬. Matplotlib - Histogram

웅'jk 2022. 11. 28. 14:47

구간을 설정하고 그 구간에 포함되는 데이터가 몇개인지를 나타내는 

차트를 히스토그램이라고 한다.

 

이전포스팅과 마찬가지로 df 는

위와 같은 데이터를 가지고 있다.

히스토그램을 만들어보자.

plt.hist(data = df, x = 'speed' , rwidth = 0.8 , bins = 30)
# speed 컬럼으로 만든다. rwidth 는 각 데이터들 사이에 공간
# bins 는 데이터의 갯수를 의미하며 30은 30개로 표현하겠다는 뜻이다.
plt.show()

bins= 의 어떤 값을 넣냐에 따라 달라지게 된다.

my_bins = np.arange(5,160+3,3) 
#bin의 범위 지정 5~160 을 데이터값 3을 기준으로 나누어라.
plt.hist(data = df, x = 'speed' , rwidth = 0.8, bins = my_bins) 
plt.show()

이번에는 여러개의 차트를 만들어보자

plt.figure(figsize = (12,5))
#차트 크기

plt.subplot(1,2,1)
# 첫번째 차트
plt.hist(data = df, x = 'speed' , rwidth = 0.8)
plt.title('speed hist, bins 10')
plt.xlabel('Speed')
plt.ylabel('# of Characters')


plt.subplot(1,2,2)
#두번째 차트
plt.hist(data = df, x = 'speed' , rwidth = 0.8, bins = 30)
plt.title('speed hist, bins 30')
plt.xlabel('Speed')
plt.ylabel('# of Characters')

plt.show()