Python/Visualization
[Visualization] seaborn으로 데이터 나타내기
gangee
2022. 11. 9. 17:48
728x90
반응형
seaborn 이란?
- matplotlib을 기반으로 하는 python 시각화 패키지
- 통계적 그래픽을 제공하는 고차원의 인터페이스 제공
seaborn 내장 데이터셋 이용하여 그래프 그리기
1. boxplot
- Boxplot : 가공하지 않은 자료를 그대로 이용하는 것이 아니라, 자료에서 얻어낸 최댓값, 최솟값을 보여주는 그래프
import seaborn as sns
sns.set(style='whitegrid', palette='pastel')
data = sns.load_dataset("tips")
- sns.set() : seaborn 스타일 옵션 설정
- sns.load_dataset() : seaborn 내장 데이터셋 로드
'tips'는 pandas.DataFrame형의 변수
sns.boxplot(x='day', y='tip', hue='sex', data=data)
- 요일별 tip에 대한 boxplot
2. heatmap
- Heatmap : 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분표 형태의 비쥬얼한 그래픽으로 출력
import seaborn as sns
sns.set(style='whitegrid', palette='pastel')
data = sns.load_dataset("flights")
pivoted_data = data.pivot("year", "month", "passengers")
pivoted_data
- pivoted_data : 기존의 data 변수를 pivot시켜서 재형성한 새로운 pandas.DataFrame형 변수
- year => index, month => column, panssengers => value
sns..set(context="poster", font="monospace", rc = {'figure.figsize':(15,15)})
sns.heatmap(pivoted_data, annot=True, fmt = 'd', linewidth=3)
- annot : True로 해야 수치 표현 가능
- fmt : 수치의 형식과 소수점자리 명시
3. scatter_matrix
- scatter_matrix : 3개 이상의 수치형 변수에 대해 두 변수를 쌍으로 조합하여 산점도를 행렬 형태로 표시
iris = sns.load_dataset('iris')
iris.head()
sns.pairplot(iris, diag_kind='hist')
plt.show()
- 4개의변수에 대한 산점도를그리고, 대각원소 자리에 diag_kind='hist'를 설정하여 각 변수 별 히스토그램을 볼 수 있도록 설정
728x90
반응형