# 구글드라이브와 연결
from google.colab import drive
drive.mount('/gdrive', force_remount=True)
from tensorflow.keras.models import load_model
import pandas as pd
# 깃허브에 준비된 데이터를 가져옵니다.
!git clone https://github.com/taehojo/data.git
# 이 중 캐글에서 내려받은 테스트셋을 불러옵니다.
kaggle_test = pd.read_csv("./data/house_test.csv")
kaggle_test
# 카테고리형 변수를 0과 1로 이루어진 변수로 바꾸어 줍니다.(15장 2절)
kaggle_test = pd.get_dummies(kaggle_test)
# 결측치를 전체 칼럼의 평균으로 대체하여 채워줍니다.
kaggle_test = kaggle_test.fillna(kaggle_test.mean())
# 업데이트된 데이터프레임을 출력해 봅니다.
kaggle_test
# 학습에 사용된 열을 저장합니다.
cols_kaggle=['OverallQual','GrLivArea','GarageCars','GarageArea','TotalBsmtSF']
K_test = kaggle_test[cols_kaggle]
#앞서 만든 모델을 불러옵니다.
model = load_model("./data/model/Ch15-house.hdf5")
modelpath="/gdrive/My Drive/Ch15-house.hdf5"
# 예측 값과 실제 값, 실행 번호가 들어갈 빈 리스트를 만듭니다.
ids =[]
# 25개의 샘플을 뽑아 실제값, 예측값을 출력해 봅니다.
Y_prediction = model.predict(K_test).flatten()
for i in range(len(K_test)):
id = kaggle_test['Id'][i]
prediction = Y_prediction[i]
ids.append([id, prediction])
# 테스트 결과의 저장 환경을 설정합니다.
import time
timestr = time.strftime("%Y%m%d-%H%M%S")
filename = str(timestr)
outdir = '/gdrive/My Drive/'
# Id와 집 값을 csv 파일로 저장합니다.
df = pd.DataFrame(ids, columns=["Id", "SalePrice"])
df.to_csv(str(outdir + filename + '_submission.csv'), index=False)
'빅데이터 분석가 양성과정 > Python - 딥러닝' 카테고리의 다른 글
이론 - 합성곱 신경망 ( Inception Network ) (0) | 2024.07.18 |
---|---|
이론 - 배치 정규화 ( Batch Noralization ) (0) | 2024.07.18 |
설명가능한 딥러닝 모델 (2) | 2024.07.18 |
전이 학습 (0) | 2024.07.18 |
이미지 증강 (0) | 2024.07.18 |