전체 글

오늘의 감사 인사1. 어제 모은 수업을 잘 참여한 저에게 감사합니다.2. 오늘 쉬고 싶다는 생각을 참고 수업을 참여한 저의 의지에 감사합니다. 3. 이렇게 비가 오는 와중에 에어컨을 틀 수 있음에 감사합니다. 채용공고 데이터 관련 이슈 뉴스 / 글
11. 상관관계를 확인하기 위해 주로 사용되는 그래프 타입 feature 간의 연관 관계 분석주요 그래프 타입heatmap 그래프산점도(scatter) 그래프 11.1. Heatmap 그래프import chart_studio.plotly as pyimport cufflinks as cfcf.go_offline(connected=True)import pandas as pddoc = pd.read_csv("COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports/04-01-2020.csv", encoding='utf-8-sidoc.corr()iplot 으로 그려보기doc2.iplot(kind='heatmap')cf.help('heatmap')cf.col..
8. 테이블 데이터와 시계열 데이터테이블 데이터 : 엑셀과 같이 행과 열로 나타낸 데이터feature: 테이블의 각 열을 의미record: 테이블의 각 행을 의미index: 각 데이터 위치를 식별하기 위한 값시계열 데이터: 일정 시간 간격으로 배치된 데이터 (시간에 종속된 데이터)이외에도 다양한 형태의 데이터가 있을 수 있으나, 대부분 테이블 데이터 형태로 처리 가능 9. 시계열 데이터 시각화를 위한 사전 준비pd.date_range(start='2020-01-01', end='2020-12-31')freq='3M': 3개월freq='D': 1일periods=10: start와 end 사이 균등 시간 분할참고: https://pandas.pydata.org/pandasdocs/stable/referenc..
6. 범주형 데이터의 요약(탐색)수준 별로 데이터 분류하기수준 별로 데이터 갯수 세기 (count)절대 빈도: 절대 갯수, 상대 빈도: 각 수준의 비율(%)시각화 하기 (빈도표, frequency table)6.1. 수준 별로 데이터 분류하기data = {'year': ['2017', '2017', '2019', '2020', '2021', '2021'],'grade': ['C', 'C', 'B', 'A', 'B', 'E'],}df = pd.DataFrame(data)df1 = df.groupby("grade").count()df2 = df.groupby("year").count()df1df2 6.2. 수준 별로 데이터 갯수 세기 (count)size : 사이즈 반환count() : 데이터가 없는 경우를..
4. 분석 타입에 따른 그래프 종류 이해: 다섯 수치 요약 (5 number summary)과 특잇값 확인상자 그래프 (boxplot) import chart_studio.plotly as pyimport cufflinks as cfcf.go_offline(connected=True)그래프 종류 확인cf.help()iplot 으로 그려보기df.iplot(kind='box')df['A'].iplot(kind='box')plotly.graph_objects 로 그려보기https://plotly.com/python/box-plots/import plotly.graph_objects as goimport plotly.offline as pyo # jupyter notebook 에서 보여지도록 설정하는 부분 (가..
2. 데이터 분류 이해데이터를 분석, 시각화, 예측하는 전반적인 과정에서 데이터에 대한 큰 그림을 이해하는 것이 도움이 됨데이터는 크게 (1) 수치형, (2) 범주형 데이터로 나눌 수 있음 수치형 데이터연속형(continuous) 데이터: 특정한 범위 안에 어떤 값(정수와 부동소숫점)이든 가질 수 있는 데이터이산(discrete) 데이터: 횟수와 같은 정수만 가질 수 있는 데이터 범주형 데이터명목형(nominal) 데이터: 카테고리, 타입, 항목 등 데이터 분류를 위해 이미 정해진 값이 있는 데이터, 데이터가 가질 수 있는 값을 수준(levels) 라고 부름순서형(ordinal) 데이터: 이미 정해진 값 사이의 순서 관계가 있는 데이터1반(1), 2반(2), 3반(3)을 나타내는 데이터가 있다면? 순서형..
황규진
'분류 전체보기' 카테고리의 글 목록 (58 Page)