'빅데이터 분석가 양성과정' 카테고리의 글 목록 (16 Page)

2024.07.06·빅데이터 분석가 양성과정/Python

Lineplot특정 데이터를 x, y로 표시하여 관계를 확인할 수 있는 plot. (선 그래프)수치형 지표들 간의 경향을 파악할 때 많이 사용합니다.# penguin 데이터에 lineplot을 출력합니다.#sns.lineplot(data=penguins, x="body_mass_g", y="flipper_length_mm", hue="species")#sns.lineplot(data=penguins, y="body_mass_g", x="flipper_length_mm", hue="sex")sns.lineplot(data=penguins, y="bill_length_mm", x="bill_depth_mm", hue="species")

Seaborn - Penguins Dataset ( Violinplot )

2024.07.06·빅데이터 분석가 양성과정/Python

Violinplot데이터에 대한 분포 자체를 보여주는 plot.boxplot과 비슷하지만, 전체 분포에 대한 그림을 보여준다는 점에서 boxplot과 다릅니다.보통 boxplot과 함께 표시하면, 평균 근처에 데이터가 얼마나 있는지(boxplot) 전체적으로 어떻게 퍼져있는지(violinplot) 모두 확인이 가능합니다.# penguin 데이터에 violinplot을 출력합니다.#sns.violinplot(data=penguins, y="flipper_length_mm", x="species", hue="species")sns.violinplot(data=penguins, y="body_mass_g", x="species", hue="sex")

Seaborn - Penguins Dataset ( Boxplot )

2024.07.06·빅데이터 분석가 양성과정/Python

Boxplot데이터의 각 종류별로 사분위 수(quantile)를 표시하는 plot.특정 데이터의 전체적인 분포를 확인하기 좋은 시각화 기법입니다.box와 전체 range의 그림을 통해 outlier를 찾기 쉽습니다. (IQR : Inter-Quantile Range)# penguin 데이터에 boxplot을 출력합니다.#sns.boxplot(data=penguins, x="flipper_length_mm", y="species", hue="species")#sns.boxplot(data=penguins, x="body_mass_g", y="species", hue="species")#sns.boxplot(data=penguins, x="body_mass_g", y="species", hue="sex")s..

Seaborn - Penguins Dataset ( Countplot )

2024.07.06·빅데이터 분석가 양성과정/Python

Countplot범주형 속성을 가지는 데이터들의 histogram을 보여주는 plot.종류별 count를 보여주는 방법입니다.# penguin 데이터에 countplot을 출력합니다.sns.countplot(data=penguins, x='species', hue='sex')

Seaborn - Penguins Dataset ( Barplot )

2024.07.06·빅데이터 분석가 양성과정/Python

Barplot어떤 데이터에 대한 값의 크기를 막대로 보여주는 plot. (a.k.a. 막대그래프)가로 / 세로 두 가지로 모두 출력 가능합니다.히스토그램과는 다릅니다!# penguin 데이터에 barplot을 출력합니다.sns.barplot(data=penguins, x="flipper_length_mm", y="species", hue='species')#sns.barplot(data=penguins, y="flipper_length_mm", x="species", hue='species')#sns.barplot(data=penguins, y="body_mass_g", x="species", hue='species')

Seaborn - Penguins Dataset ( Displot )

2024.07.06·빅데이터 분석가 양성과정/Python

DisPlotdistribution들을 여러 subplot들로 나눠서 출력해주는 plot.displot에 kind를 변경하는 것으로, histplot, kdeplot, ecdfplot 모두 출력이 가능합니다.e.g. displot(kind="hist") # penguin 데이터에 displot을 출력합니다.sns.displot(data=penguins, x="flipper_length_mm", hue="species", col="species")

Seaborn - Penguins Dataset ( Histogram )

2024.07.06·빅데이터 분석가 양성과정/Python

# Data Loadimport seaborn as snssns.set_theme(style='whitegrid')penguins = sns.load_dataset("penguins")penguins Histogram가장 기본적으로 사용되는 히스토그램을 출력하는 plot.전체 데이터를 특정 구간별 정보를 확인할 때 사용합니다.# penguin 데이터에 histplot을 출력합니다.sns.histplot(data=penguins, x="flipper_length_mm", hue="species", multiple='stack')

Seaborn - Tatanic Dataset( 상관 Heatmap )

2024.07.06·빅데이터 분석가 양성과정/Python

컬럼간의 상관도를 Heatmap형태로 표현titanic_df.corr()### 상관 Heatmapplt.figure(figsize=(8, 8))# DataFrame의 corr()은 숫자형 값만 상관도를 구함. corr = titanic_df.corr()sns.heatmap(corr)#sns.heatmap(corr, annot=True, fmt='.1f', linewidths=0.5, cmap='YlGnBu')#sns.heatmap(corr, annot=True, fmt='.2g', cbar=True, linewidths=0.5, cmap='YlGnBu')

Seaborn - Titanic Dataset ( scatter plot )

2024.07.06·빅데이터 분석가 양성과정/Python

산포도로서 X와 Y축에 보통 연속형 값을 시각화. hue, style등을 통해 breakdown 정보를 표출할 수 있습니다.sns.scatterplot(x='Age', y='Fare', data=titanic_df) sns.scatterplot(x='Age', y='Fare', data=titanic_df, hue='Survived') sns.scatterplot(x='Age', y='Fare', data=titanic_df, hue='Pclass',style='Survived')

티스토리툴바