빅데이터 분석가 양성과정
# 구글드라이브와 연결from google.colab import drivedrive.mount('/gdrive', force_remount=True) from tensorflow.keras.models import load_modelimport pandas as pd# 깃허브에 준비된 데이터를 가져옵니다.!git clone https://github.com/taehojo/data.git# 이 중 캐글에서 내려받은 테스트셋을 불러옵니다.kaggle_test = pd.read_csv("./data/house_test.csv")kaggle_test # 카테고리형 변수를 0과 1로 이루어진 변수로 바꾸어 줍니다.(15장 2절)kaggle_test = pd.get_dummies(kaggle_test)# 결측치를..
설명 방법설명이 가능한 딥러닝을 XAI(Explainable AI)라고도 함예측의 근거를 설명해 주는 기술1 - CAM( Class Activation Map ) 2 - 마스크 방식, 오클루전 방식 - 폐쇄성 민감도코드!pip install opencvGradient CAMfrom tf_explain.core.grad_cam import GradCAMfrom tf_explain.core.occlusion_sensitivity import Occlusion Sensitivitymodel = VGG16(weights="imagenet", include_top=True)explainer = GradCAM() #그레이디언트 CAM 알고리즘 선택output = exp..
전이 학습(transfer learning) : 여러 방법 중에서 수 만장에 달하는 기존의 이미지에서 학습한 정보를 가져와 내 프로젝트에 활용하는 것 전이 학습을 하는 방법먼저 대규모 데이터 셋에서 학습된 기존의 신경망을 불러옴CNN 모델의 앞쪽을 이 신경망으로 채움뒤쪽 층에서 나의 프로젝트와 연결함이 두 신경망이 잘 맞물리게끔 미세 조정(Fine tuning)을 하면 됨전이학습 구조 transfer_model = VGG16(weights='imagenet', include_top=False, input_shape=(150, 150, 3))transfer_model.trainable = Falsetransfer_model.summary() Fine-tuning(Transfer Learning)이미 학습된..
정답지를 가지고 학습을 하는 딥러닝 및 머신러닝 알고리즘은 지도 학습(Supervised Learning)으로 분류됨지도 학습에 있어서, 알고리즘의 성능을 향상시키기 위해선 수많은 정답지를 지닌 데이터가 존재해야만 함하지만 현실에서는 학습에 사용할 데이터가 매우 적은 상황이 많음이 때 데이터셋을 증강시켜주는 이미지 증강(Image Augmentation) 기법을 사용할 수 있음 이미지 증강 기법은 원본 이미지를 회전시키거나(rotate), 뒤집거나(flip), 자른다(cut)데이터의 증가로 인해 모델의 학습이 더 잘될 수밖에 없음이미지를 자르거나 섞는 방법으로 만들어진 새로운 이미지는 모델의 과적합(Overfitting)을 막아주는 중요한 역할을 함또한 이미지 증강은 오직 학습 데이터셋에만 적용하는 것임..