가장 최신 기술로, 손쉽게 시각화 익히기
- matplotlib은 오래된 전통적인 라이브러리
- 이 한계를 보완하기 위해 seaborn 라이브러리가 출현
- 오래된 라이브러리로 인터페이스가 복잡함
- 최신 시각화 라이브러리 : plotly
- pandas 기능과 plotly를 조합해서 최신/가장 빠르게 시각화 가능
- pandas 데이터 프레임.iplot() 같은 형태로 데이터 프레임을 바로 그래프로 그릴 수 있음
iplot()으로 시각화 사용하기
데이터 프레임.iplot(kind=그래프 종류) 만으로 그래프를 그릴 수 있으므로, 매우 쉬움 단, 관련 자료가 부족하고, 세부 기능 조정에 한계가 있음
데이터 분석 시, 가볍게 데이터 확인 시는 iplot, 디테일 하게 시각화 할 시에는 plotly.graph_objects 를 사용하는 것이 좋음
1.라이브러리 설치
- chart_studio 는 plotly 로 작성된 그래프를 웹 상에서 보여주기 위한 라이브러리
- 최근에는 둘 다 설치해야 함
!pip install plotly chart_studio --upgrade
- cufflinks
- pandas로 그래프를 그리기 위한 기능을 plotly 와 연결 시키기 위한 라이브러리
!pip install cufflinks --upgrade
2. 라이브러리 로드
- pandas 데이터 프레임.iplot() 함수 호출 전에 로드 해야 함
import chart_studio.plotly as py
import cufflinks as cf
cf.go_offline(connected=True)
3. 테스트 예제
- numpy.random.rand(m, n)
- m 행, n 열로 0 ~ 1의 균일 분포(모든 데이터가 나올 확률이 동일함)에 맞는 랜덤 데이터 생성
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.rand(10, 2), columns=['A', 'B'])
df.head()
4. 주요 사용법
- 데이터 프레임.iplot(kind=그래프 종류)
- 그래프 종류
cf.help()
- 주요 사용법이 웹보다 다음 help() 함수를 통해 그나마 잘되어 있음
cf.help('bar')
그래프 라이브러리 세부 옵션을 모두 나열하기는 불가능 iplot()는 가볍게 사용하기로 하였으므로, 여기서 bar와 scatter 주요 사용법을 익히고, 필요한 부분을 찾아볼 수 있는 방법을 알아봄
'빅데이터 분석가 양성과정 > Python' 카테고리의 다른 글
iplot - 선 그래프 / 세부 요소 변경 (0) | 2024.07.08 |
---|---|
iplot - 막대 그래프 (0) | 2024.07.08 |
공공데이터 분석(커피전문점) - 시각화 (0) | 2024.07.08 |
공공데이터 분석(커피전문점) - 유명 브랜드별 비율 비교하기 (0) | 2024.07.08 |
공공데이터 분석(커피전문점) - View data (0) | 2024.07.08 |