iris 데이터를 활용한 다중 분류 실습 import pandas as pd!git clone # 깃허브에 준비된 데이터를 가져옴df = pd.read_csv('./data/iris3.csv’)df.head()import seaborn as snsimport matplotlib.pyplot as plt# 상관도 그래프# pairplot( ) - 관계 그래프sns.pairplot(df, hue='species')plt.show() # 1. 환경 구축from tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Denseimport pandas as pdimport seaborn as snsimport matplotli..
빅데이터 분석가 양성과정
빅데이터와 인공지능(머신 러닝, 딥러닝)세월이 흐르면서 쌓인 방대한 데이터를 빅데이터라고 함이 ‘빅데이터’는 분명히 머신 러닝과 딥러닝으로 하여금 사람에 버금가는 판단과 지능을 가질 수 있게끔 했음.빅데이터의 질데이터 양도 중요하지만 그 안에 ‘필요한’ 정보가 얼마나 있는가가 중요데이터 양이 많다고 무조건 좋은 결과를 얻을 수 있는 것은 아님준비한 데이터가 사용하려는 머신 러닝과 딥러닝에 효율적으로 사용될 수 있도록 잘 가공되어 있는지 역시 중요머신 러닝 프로젝트의 성공과 실패얼마나 좋은 데이터를 가지고 시작하느냐에 영향을 많이 받음여기서 좋은 데이터란?한쪽에 치우지지 않고 불필요한 정보가 적으며 왜곡되지 않은 데이터를 의미데이터를 잘 정제된 형식으로 변경이 필요 실습) 피마 인디언 데이터 분석비만은 유..
실습) 폐암 수술 환자의 생존율 예측하기 코드 # 1. 환경 준비from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense import numpy as np# 2. 데이터 준비!git clone Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",")X = Data_set[:,0:16] y = Data_set[:,16] # 3. 모델 구조 결정model = Sequential() ..
인간의 뇌는 치밀하게 연결된 뉴런(신경 세포) 약 1,000억 개로 구성뉴런(신경 세포)과 뉴런(신경 세포) 사이에는 시냅시스라는 연결 부위가 있는데, 신경 말단에서 자극을 받으면 시냅시스에서 화학 물질이 나와 전위 변화를 이르킴전위가 임계 값을 넘으면 다음 뉴런(신경 세포)으로 신호를 전달, 임계 값에 미치지 못하면 아무 것도 하지 않음퍼셉트론은 입력 값을 여러 개 받아 출력을 만드는데, 이대 입력 값에 가중치를 조절할 수 있게 만들어 최초로 ‘학습’을 하게 했음3년 후, 여기에 앞 장에서 다른 경사 하강법을 도입해 최적의 경계선을 그릴 수 있게 한 아달라인(Adaline)이 개발아달라인 이후 서포트 벡터 머신 등 머신 러닝의 중요한 알고리즙들로 발전해 가는데, 이 중 시그모이드를 활성화 함수로 사용한..
예측선(판단 기준)을 직선으로 표현하는 것이 적절하지 않은 경우가 있음위의 데이터 같은 경우 s자 형태의 곡선이어야 한다. 시그모이드 함수 # 1. 환경 준비import numpy as npimport matplotlib.pyplot as pltfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense# 2. 데이터 준비x = np.array([2, 4, 6, 8, 10, 12, 14])y = np.array([0, 0, 0, 1, 1, 1, 1])# 3. 모델 구조 결정model = Sequential()# 입력이 하나 출력도 하나인 모델 / 활성화 함수는 시그모이드model.add(Dense(1, inp..
선형회귀단순 선형 회귀(simple linear regression)독립 변수 x(‘정보’) 하나로 종속 변수 y 값을 예측할 수 있는 경우의 분석 작업코드 import numpy as npimport matplotlib.pyplot as pltX = np.array([2, 4, 6, 8])Y = np.array([81, 93, 91, 97])plt.plot(X,Y,'o')plt.xlabel('study time')plt.title('Jumsu vs. study time')plt.grid()$y=ax+b$를 결정하기 위해 기울기 a와 절편 b값은 최소제곱법으로 구할 수 있음 주어진 표에 제시한 테이터를 기반으로 예측선을 만들려고 한다계산결과 : a=2.3, b=79.0# 공부한 시간과 점수를 각각 x, ..