Python/Visualization

[Visualization] seaborn으로 데이터 나타내기

gangee 2022. 11. 9. 17:48
728x90
반응형

seaborn 이란?

  • matplotlib을 기반으로 하는 python 시각화 패키지
  • 통계적 그래픽을 제공하는 고차원의 인터페이스 제공

seaborn 내장 데이터셋 이용하여 그래프 그리기

1. boxplot

  • Boxplot : 가공하지 않은 자료를 그대로 이용하는 것이 아니라, 자료에서 얻어낸 최댓값, 최솟값을 보여주는 그래프
import seaborn as sns

sns.set(style='whitegrid', palette='pastel')

data = sns.load_dataset("tips")
  • sns.set() : seaborn 스타일 옵션 설정
  • sns.load_dataset() : seaborn 내장 데이터셋 로드
    'tips'는 pandas.DataFrame형의 변수
sns.boxplot(x='day', y='tip', hue='sex', data=data)
  • 요일별 tip에 대한 boxplot

2. heatmap

  • Heatmap : 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분표 형태의 비쥬얼한 그래픽으로 출력
import seaborn as sns

sns.set(style='whitegrid', palette='pastel')

data = sns.load_dataset("flights")
pivoted_data = data.pivot("year", "month", "passengers")
pivoted_data
  • pivoted_data : 기존의 data 변수를 pivot시켜서 재형성한 새로운 pandas.DataFrame형 변수
  • year => index, month => column, panssengers => value
sns..set(context="poster", font="monospace", rc = {'figure.figsize':(15,15)})
sns.heatmap(pivoted_data, annot=True, fmt = 'd', linewidth=3)
  • annot : True로 해야 수치 표현 가능
  • fmt : 수치의 형식과 소수점자리 명시

3. scatter_matrix

  • scatter_matrix : 3개 이상의 수치형 변수에 대해 두 변수를 쌍으로 조합하여 산점도를 행렬 형태로 표시
iris = sns.load_dataset('iris')
iris.head()
sns.pairplot(iris, diag_kind='hist')
plt.show()
  • 4개의변수에 대한 산점도를그리고, 대각원소 자리에 diag_kind='hist'를 설정하여 각 변수 별 히스토그램을 볼 수 있도록 설정
728x90
반응형