데이터 인코딩데이터 전처리는 알고리즘 만큼 중요. (Garbage in, Garbage out)데이터는 문자열을 입력 값으로 허용 하지 않는다.문자열을 인코딩하여 숫자로 변화 feature vectorization 기법 Label encodingsklearn.preprocessing.LabelEncoderfrom sklearn.preprocessing import LabelEncoderitems = ['TV', '냉장고', '전자렌지', '컴퓨터', '선풍기', '믹서', '믹서']#labelEncoder를 객체로 생성한 후 .fit()과 transform()으로 label 인코딩 수행.encoder = LabelEncoder()encoder.fit(items)labels = encoder.transfo..
실습 데이터 생성import pandas as pdimport numpy as np# 실습 데이터 생성df = pd.DataFrame(data = np.arange(18).reshape(6,3), index = ['a','b','c','d','e','f'], columns=['col1','col2','col3']) df['col4'] = pd.Series(data = [1.7, 1.2, 2.4], index = ['a','e','c'])df.loc['c'] = Noneprint('Sample Data')print(df)Sample Data col1 col2 col3 col4a 0.0 1.0 2...
명상오늘의 감사 인사1. 오늘 늦지 않고 모닝스쿨에 참여한 저에게 감사합니다.2. 방학에도 늦지 않고 모닝스쿨을 참여한 취업사관학교 9기 감사합니다.3. 새로 취업사관학교에 들어와 취업을 희망하는 사람이 있다는 것에 감사합니다. 오늘의 용어 주니어 채용채용팀 -> 영입팀채용공고에 맞는 역량과 준비가 되어 있어야 한다.모닝스쿨 후기오늘 오랜만에 모닝스쿨에 참석을 했습니다.매일 스스로 모닝스쿨을 하다가 모닝스쿨을 하니 어색하기도 하지만, 열심히 참여했습니다.취업을 성공하는 그 날까지 지각이 참석하도록 노력하겠습니다.
4.8. 연도 별 분석merged_order_payment_year = merged_order_payment_date[['year', 'payment_value']].copy()merged_order_payment_yearmerged_order_payment_year = merged_order_payment_year.groupby('year').sum()merged_order_payment_year.head()merged_order_payment_year.iplot(kind='bar', theme='white')은근히 x tick 제어가 필요할 때가 꽤 있음layout = { 'xaxis': { 'showticklabels':True, 'tickvals':[2016, 201..
1. 실제 데이터 분석과 도메인의 이해데이터 분석을 통해 얻어야 할 질문이 있어야 함해당 도메인에 대한 깊은 이해가 있을 수록 더 깊은 분석/인사이트 도출 가능데이터 분석 뿐만 아니라, 데이터 예측도 해당 도메인을 가장 잘 이해하는 사람이 가장 잘 하게 되어 있음단순히 기술을 잘 사용할 수 있다고 잘 하는 것이 아님이커머스(e-commerce) 데이터 분석온라인 비즈니스 활성화로 온라인 상에서의 데이터 분석이 중요해짐온라인 비즈니스는 유사성을 가지고 잇고, 이 중 가장 활발한 분야가 이커머스(e-commerce)임관련 도메인(업계) 데이터 분석을 통해 온라인 비즈니스 데이터에 대해서도 조금씩 익숙해질 수 있음 2. 사전 준비데이터브라질에서 가장 큰 백화점의 이커머스 쇼핑몰 (https://olist.co..
코로나 국가별 확진자 수 추이 분석/시각화날짜별 확진자수 최종 데이터프레임 읽기 (df_confirmed)import pandas as pddf_confirmed = pd.read_csv("COVID-19-master/final_df.csv")df_confirmed.head()df_confirmed.shape(201, 1144) 국가명과 iso2 매칭 테이블 읽기 (country_info)iso2 컬럼값으로 https://www.countryflags.io/ 에서 제공하는 국기 이미지 링크를 얻을 수 있음 (flagcdn.com 로 대체)다음 데이터는 결측치로 변환됨‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IND..