Seaborn - Kaggle Survey EDA(2)

2024. 7. 8. 11:28·빅데이터 분석가 양성과정/Python

EDA에서는 다음과 같은 항목을 살펴봅니다.

  • 기본적인 빈도 분석
  • 히스토그램
  • Pie chart와 같은 plotting 기법들

Q5 column

  • Select the title most similar to your current role

    
python
Q5 = final_data["Q5"][1:]; Q5
Q5.value_counts()

    
python
plt.figure(figsize=(12, 12))
#plt.hist(Q5)
plt.barh(Q5.value_counts().index, Q5.value_counts().values)
plt.xticks(rotation='vertical')
plt.title("Histogram for Q5 column")
plt.show()


    
python
plt.figure(figsize=(16, 16))
plt.pie(Q5.value_counts(),
labels=Q5.value_counts().index,
autopct='%d%%',
textprops={'fontsize':24})
plt.axis('equal')
plt.title("Pie chart for Q5 column", fontsize=48, pad=50)
plt.show()

Q20 column

  • What is the size of the compnay where are employed?

    
python
Q20 = final_data["Q20"][1:]
Q20.value_counts()


    
# sns.countplot을 사용해봅시다.
sns.countplot(y="Q20", data=final_data[1:])
plt.show()


    
python
plt.figure(figsize=(8,8))
plt.pie(Q20.value_counts(),
labels=Q20.value_counts().index,
autopct='%d%%',
colors=sns.color_palette('hls',len(Q20.value_counts().index)),
textprops={'fontsize':16})
plt.axis('equal')
plt.title("Pie chart for Q20 column", fontsize=32, pad=50)
plt.show()

Q22 column

  • Does your current employer incorporate machine learning methods into their business?

    
python
Q22 = final_data["Q22"][1:]
Q22.value_counts()


    
plt.figure(figsize=(12, 16))
# To-Do
plt.barh(Q22.value_counts().index, Q22.value_counts().values)
plt.show()


    
plt.figure(figsize=(12, 12))
plt.pie(Q22.value_counts(),
labels=Q22.value_counts().index,
autopct='%.2f%%',
colors=sns.color_palette('hls',len(Q22.value_counts().index)),
textprops={'fontsize':12})
plt.axis('equal')
plt.title("Pie chart for Q22 column", fontsize=32, pad=50)
plt.show()

Q3

  • In which country do you currently reside?

    
# (OPTIONAL)
#set(data["Q3"]) # --> "Republic of Korea" / "South Korea"
skorea = data[data["Q3"].isin(["Republic of Korea", "South Korea"])]
skorea.head()


    
sQ4 = skorea["Q4"]
sQ4.value_counts()


    
sns.countplot(y="Q4", data=skorea[1:])
plt.show()


    
plt.figure(figsize=(12, 12))
plt.pie(sQ4.value_counts(),
labels=sQ4.value_counts().index,
autopct='%.2f%%',
colors=sns.color_palette('hls',len(sQ4.value_counts().index)),
textprops={'fontsize':12})
plt.axis('equal')
plt.title("Pie chart for Q4 column in South Korea", fontsize=32, pad=50)
plt.show()

'빅데이터 분석가 양성과정 > Python' 카테고리의 다른 글

공공데이터 분석(커피전문점) - View data  (0) 2024.07.08
공공데이터 분석(커피전문점) - Load Data  (0) 2024.07.08
Seaborn - Kaggle Survey EDA(1)  (0) 2024.07.08
Seaborn - Mushrooms DataSet  (1) 2024.07.08
Seaborn - Penguins Dataset ( Heatmap )  (0) 2024.07.08
'빅데이터 분석가 양성과정/Python' 카테고리의 다른 글
  • 공공데이터 분석(커피전문점) - View data
  • 공공데이터 분석(커피전문점) - Load Data
  • Seaborn - Kaggle Survey EDA(1)
  • Seaborn - Mushrooms DataSet
분석가 황규진
분석가 황규진
공공기관 위험평가관련 부서에서 근무하고 있습니다.
HGJ's Insight공공기관 위험평가관련 부서에서 근무하고 있습니다.
글쓰기 관리
분석가 황규진
HGJ's Insight
홈
|
로그인
  • 전체 글 563
    • 개인 활동(일상) 3
      • 독서 2
      • 근황 공유 1
    • 개인 활동(공부) 49
      • Tableau Bootcamp 10
      • 금융 공부 5
      • 직무 공부 22
      • 강의 12
    • 개인프로젝트 4
      • 신용카드 연체 평가 모델 0
      • 대출 승인 여부 예측 모델 4
    • 자격증 7
      • 빅데이터분석기사 1
      • 정보처리기사 1
      • 경영정보시각화 1
      • SQL개발자(SQLD) 1
      • 데이터 분석 준전문가(ADsP) 1
      • 통계적품질관리(SPC) 1
      • AICE Associate 1
    • 코드 정리 11
      • 코드 정리 - Tistory 8
      • 코드 정리 - Python 3
    • 코딩테스트연습 116
      • SQL_프로그래머스 116
    • 취업사관학교 9기 199
      • 모닝스쿨 54
      • 스스로 모닝스쿨 125
      • 직무 스터디 20
      • 반성과 다짐 0
    • 빅데이터 분석가 양성과정 173
      • Python 88
      • Python - 머신러닝 26
      • Python - 딥러닝 31
      • PyQt 4
      • JavaScript 10
      • MySQL 13
      • Node.js 1
hELLO· Designed By정상우.v4.6.1
분석가 황규진
Seaborn - Kaggle Survey EDA(2)
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.