Voilin plot단일 컬럼에 대해서는 히스토그램과 유사하게 연속값의 분포도를 시각화. 또한 중심에는 4분위를 알수있음.보통은 X축에 설정한 컬럼의 개별 이산값 별로 Y축 컬럼값의 분포도를 시각화하는 용도로 많이 사용# Age 컬럼에 대한 연속 확률 분포 시각화 sns.violinplot(y='Age', data=titanic_df)# x축값인 Pclass의 값별로 y축 값인 Age의 연속분포 곡선을 알 수 있음. sns.violinplot(x='Pclass', y='Age', data=titanic_df)# x축인 Sex값 별로 y축값이 Age의 값 분포를 알 수 있음. sns.violinplot(x='Sex', y='Age', data=titanic_df)
빅데이터 분석가 양성과정/Python
seaborn의 countplot은 카테고리 값에 대한 건수를 표현. x축이 카테고리값, y축이 해당 카테고리값에 대한 건수sns.countplot(x='Pclass', data=titanic_df)sns.countplot(y='Pclass', data=titanic_df) seaborn의 barplot은 x축은 이산값(주로 category값), y축은 연속값(y값의 평균/총합)을 표현#plt.figure(figsize=(10, 6))# 자동으로 xlabel, ylabel을 x입력값, y입력값으로 설정. sns.barplot(x='Pclass', y='Age', data=titanic_df)sns.barplot(x='Pclass', y='Survived', data=titanic_df)### 수직 bar..
#데이터 로드import pandas as pdtitanic_df = pd.read_csv('titanic_train.csv')titanic_df.head(5)연속값에 대한 구간별 도수 분포를 시각화### matplotlib histogramimport matplotlib.pyplot as pltplt.hist(titanic_df['Age'])#plt.show() (array([ 54., 46., 177., 169., 118., 70., 45., 24., 9., 2.]), array([ 0.42 , 8.378, 16.336, 24.294, 32.252, 40.21 , 48.168, 56.126, 64.084, 72.042, 80. ]), # Pandas 에서 hist 함수를 바로 호출할 수 있음. tit..
Seaborn seaborn: statistical data visualization — seaborn 0.13.2 documentationseaborn: statistical data visualizationseaborn.pydata.orgMatplotlib 보다 쉽고, 예쁘게, Pandas 와의 쉬운 연동Matplotlib 기반으로 쉽게 작성됨Matplotlib의 high level API 라고 이해하면 편함Default 설정만으로 Matplotlib 보다 수려한 Visual 제공하며 Pandas 와 쉽게 연동그러나 Matplotlib를 어느 정도 알고 있어야함Seaborn Axes Level vs Figure Level 함수Axes Level은 기존 Matplotlib과 유사하게 개별 Axes가 P..
x축, y축에 축명을 텍스트로 할당. xlabel, ylabel 적용plt.plot(x_value, y_value, color='red', marker='o', linestyle='dashed', linewidth=2, markersize=12)plt.xlabel('x axis')plt.ylabel('y axis')plt.show()x축, y축 틱값을 표현을 회전해서 보여줌. x축값이 문자열이고 많은 tick값이 있을 때 적용x_value = np.arange(1, 100)y_value = 2*x_valueplt.plot(x_value, y_value, color='green')plt.xlabel('x axis')plt.ylabel('y axis')plt.xticks(rotation=45)#plt.yti..
MatplotlibPython Graph Visualization 으로 가장 많이 사용되는 라이브러리.Python Visualization에 많은 공헌을 함.3차원 이상의 입체 시각화도 다양하게 지원그러나 직관적이지 못한 API 로 인해 개발에 익숙해 지는데 많은 시간이 필요하며 기본 설정 환경에서 현대적인 감각이 떨어지는 Visual 개선 필요Matplotlib.pyplot 모듈의 이해pyplot의 두가지 중요 요소 - Figure 와 Axes여러 개의 plot을 가지는 Figureimport matplotlib.pyplot as plt#%matplotlib inlineplt.plot([1, 2, 3], [2, 4, 6]) plt.title("Hello plot") plt.show()# plt.figu..