Step 0. 사기탐지 분류 모형 개요금융 데이터의 특성 (Review)1) 이종(heterogeneous) 데이터의 결합2) 분포의 편향성(skewness)3) 분류 레이블의 불명확성4) 변수의 다중공선성(multicollinearity)5) 변수의 비선형성그 외 현실적인 규제·수집·저장 등의 한계 때문에 데이터가 불완전(missing, truncated, censored)할 수 있음불균형 데이터1) X (피처)의 불균형범주변수일 경우 범주에 따라 빈도가 낮을 수 있음고차원 피처 공간의 축소(Feature Transformation)PCA, t-SNE 등의 알고리즘 사용2) y (타겟)의 불균형여신(대출), 수신(적금), 보험(클레임), 카드(사기탐지), 거시경제(불황) 등 대부분의 금융 데이터는 희..
빅데이터 분석가 양성과정/Python - 딥러닝
철판 제고 공정데이터를 활용한 분류 모형 생성 및 성능 비교데이터 특성Steel Plates Faults 데이터는 1941개의 샘플을 가지며 아래의 종속변수들과 나머지 설명변수들로 구성됩니다.종속변수 (7개) - 어떠한 불량이 나타났는지를 나타내고, 다음과 같습니다.Pastry, Z_Scratch, K_Scatch, Stains, Dirtiness, Bumps, Other_Faults설명변수 (27개) - 철판의 길이, 반짝이는 정도, 두께, 타입 등 등 다양한 변수들을 가집니다.첫번째 칼럼 X_Minimum ~ 27번째 칼럼 SigmoidOfAreas데이터출처: https://www.kaggle.com/mahsateimourikia/faults-nna/notebooks제조 공정 데이터의 전반적 특성제조..
미리 학습된 GoogLeNet 학습 모델 및 구성 파일 다운로드Caffe Model Zoo: https://github.com/BVLC/caffe모델 파일: http://dl.caffe.berkeleyvision.org/bvlc_googlenet.caffemodel설정 https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/ deployprototxt ONNX model zoo: https://github.com/onnx/models모델 파일: https://github.com/onnx/models/tree/master/vision/classification/inception_and_googlenet/googlenet 클래스 이름파일: 1~100..