데이터 다루기/데이터 시각화

[Python 시각화] Box plot

분석벌레 2022. 12. 22. 10:57
728x90
반응형

안녕하세요.

 

이번 포스팅에서는 Python에서 Box plot (상자 그래프) 을 그리는 방법에 대해서 배워보도록 하겠습니다.

 

(1) 패키지 불러오기

 

사용할 패키지는 matplotlib과 seaborn 입니다.

 

import matplotlib.pyplot as plt
import seaborn as sns

 

(2) 데이터 불러오기

 

Box plot을 그리는 데 활용할 실습 데이터는 seaborn 패키지에 내장된 tips 데이터 입니다.

 

tips = sns.load_dataset('tips')
tips.head()

 

 

(3) 시각화

  • 그래프 배경 스타일 설정

흰색 배경의 그리드 스타일로 변경해주자.

 

sns.set_style("whitegrid")

 

 

  • 수평 및 수직 조절

그리고자 하는 변수를 x와 y인자에 사용할지를 변경함에 따라 수직 Box plot과 수평 Box plot을 정할 수 있다.

 

sns.boxplot(x = "total_bill",  data = tips)

sns.boxplot(y = "total_bill",  data = tips)

 

Box plot의 형태를 변경시킬 수 있는 인자들도 알아두면 좋다.

color: 색상
width: 박스 폭 (0~1)
fliersize: 아웃라이어 마커 사이즈
linewidth: 라인 두꼐
saturation: 색상 채도 (0~1)

 

  • 그룹 별 Box plot 시각화

그룹에 해당되는 변수를 x에 그리고자 할 변수를 y인자에 입력하면 그룹 별 Box plot을 쉽게 그릴 수 있다.

 

sns.boxplot(x = "day", y = "total_bill", data = tips)

 

 

hue 인자를 사용하면 이변량에 대해서도 그릴 수 있다.

 

sns.boxplot(x = "day", y = "total_bill",  width = 0.6, hue = "smoker", data = tips)

 

palette를 변경해주면 색상을 더 이쁘게 바꿔줄 수 있다.

 

sns.boxplot(x = "day", y = "total_bill",  width = 0.6, hue = "smoker", palette = "Set3", data = tips)

 

  • Swarmplot

Swarmplot은 Box plot 위에 산점도를 추가하는 방법니다.

 

sns.boxplot(x="day", y="total_bill", data=tips)
sns.swarmplot(x="day", y="total_bill", data=tips, color=".25")

 

 

 

반응형