모델 성능에 비교 시각화
각 모델 성능 시각화 [ 혼동 행렬 ]
대출 데이터의 특징
- 범주형(성별, 주거형태, 대출 목적 등)과 수치형(소득, 신용점수, 근속연수 등)이 섞여 있음.
- 보통 "승인" 비율이 높고 "거절" 비율이 낮아 불균형 데이터임.
- 변수 간 관계가 비선형적이고 복잡함.
따라서 변수 간 비선형 관계를 잘 잡아내고 변수 간 상호작용도 자동으로 고려한다고 알려져 있는 RandomForest, XGBoost 같은 트리 기반 앙상블 모델 성능이 다른 Logistic, KNN, SVC보다 더 잘 나온 것 같다고 생각한다.
이후, 직접 SMOTE기법을 활용하여 원본 데이터를 활용하여 프로젝트를 다시 보완하도록 하겠다.
'개인프로젝트 > 대출 승인 여부 예측 모델' 카테고리의 다른 글
대출 승인 여부 예측 모델 개발 ( 데이터 전처리 ) (0) | 2025.08.23 |
---|---|
대출 승인 여부 예측 모델 개발 ( 데이터 확인 및 탐색 ) (0) | 2025.08.22 |
대출 승인 여부 예측 모델 개발 ( 데이터 소개 ) (0) | 2025.08.21 |