빅데이터 분석가 양성과정

데이터 전처리Null 처리불필요한 속성 제거인코딩 수행모델 학습 및 검즘/예측/평가결정 트리, 랜덤 포레스트, 로지스틱 회귀 학습 비교K 폴드 교차 검증cross_val_score()와 GridSearchCV()수행 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinetitanic_df = pd.read_csv('./titanic_train.csv')titanic_df.head(3) print('\\n ### train 데이터 정보 ### \\n')print(titanic_df.info())titanic_df['Age'].fillna(titanic_df['Age']...
실습붓꽃 데이터 불러오기from sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_splitimport pandas as pdiris = load_iris()iris_data = iris.datairis_label = iris.targetprint('iris target 값:', iris_label)print('iris target 명:', iris.target_names)iris_df = pd.DataFrame(data = iris_data, columns = iris.feature_names)iris_df['label'] = ..
Scikit-learn 소개와 특징파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API를 지향할 정도로 쉽고 가장 파이썬 스러운 API를 제공합니다.머신러닝을 위한 매우 다양한 알고리즘과 개발을 위한 편리한 프레임워크와 API를 제공합니다.오랜 기간 실전 환경에서 검증됐으며, 매우 많은 환경에서 사용되는 성숙한 라이브러리 입니다.주로 Numpy와 Scipy 기반 위에서 구축된 라이브러리 입니다.지도학습 - 분류분류(Classfication)는 대표적인 지도학습(Supervised LEarning)방법의 하나 입니다. 지도학습은 학습을 위한 다양한 피처와 분류 결정값인 레이블(Label) 데이터로 모델을 학습한 뒤, 별도의 테스트 데이터 세트에서 미지의 레이블을 예측합니다.즉, 지도학습은 명확한 ..
Machine learning (ML)인공지능의 미래모든 산업과 사회 분야에 깊숙이 파고들어 무한한 부를 창출자신의 전문분야는 다른 전공자가 접근하기 어렵기 때문에 자신만이 최적의 맞춤형 인공지능 서비스를 제작할 수 있음인공지능 서비스는 분야별로 특성이 다르기 때문에 빅데이터 분석 방법이나 인공지능 서비스 모델의 적용이 달라짐자신의 전공을 최대한 살리는 방법기계 학습이란현재의 컴퓨터는 스스로 학습할 수 없기 때문에 우리가 컴퓨터에게 어떤 작업을 시키려면 반드시 프로그램을 작성하여 작업을 지시하여야 한다.컴퓨터가 스스로 학습할 수 있다면 컴퓨터는 프로그램 없이도 여러 가지 일을 할 수 있을 것이다.Why Machine learning (ML) ?현실 세계의 복잡한 업무와 규칙을 구현하기 위한 매우 복잡하고..
주피터 노트북 설치pip install notebook   윈도우 프로그래밍기본 윈도 창의 구성from tkinter import *window = Tk()#이부분에서 화면을 구성하고 처리window.mainloop()from tkinter import *window = Tk()window.title('윈도창 연습')window.geometry('400x100')window.resizable(width = False, height = False)window.mainloop()크기 변경 안됨 from tkinter import *window = Tk()label1 = Label(window, text = 'This is MySQL을')label2 = Label(window, text = '열심히', fon..
지리 정보 시스템의 개념지리 정보 시스템이란? (GIS)지표면과 지상 공간에 존재하고 있는 각종 자연물(산, 강, 토지 등)과 인공물(건물, 도로, 철도 등)에 대한 위치 정보와 속성 정보를 컴퓨터에 입력 후, 이를 연계 시켜 각종 계획 수립과 의사 결정 및 산업 활동을 효율적으로 지원 할 수 있도록 만든 첨단 정보 시스템지도와 그에 따른 텍스트(속성) 정보를 컴퓨터에 입력한 후에 , 그 입력된 전자 지도를 교통, 환경, 농업, 생활, 시설물 관리 등의 다양한 곳에 응용하는 분야GIS에서 사용되는 데이터의 기본 구조속성 데이터기존에 사용해 왔던 문자, 숫자, 날짜 등의 데이터 형식공간 데이터지구 상에 존재하는 지형 정보를 표현한 데이터종이지도에 표현된 강, 도로, 나무, 건물, 가로등, 전봇대 등의 모든..
황규진
'빅데이터 분석가 양성과정' 카테고리의 글 목록 (10 Page)