'빅데이터 분석가 양성과정' 카테고리의 글 목록 (4 Page)

2024.07.17·빅데이터 분석가 양성과정/Python - 딥러닝

인간의 뇌는 치밀하게 연결된 뉴런(신경 세포) 약 1,000억 개로 구성뉴런(신경 세포)과 뉴런(신경 세포) 사이에는 시냅시스라는 연결 부위가 있는데, 신경 말단에서 자극을 받으면 시냅시스에서 화학 물질이 나와 전위 변화를 이르킴전위가 임계 값을 넘으면 다음 뉴런(신경 세포)으로 신호를 전달, 임계 값에 미치지 못하면 아무 것도 하지 않음퍼셉트론은 입력 값을 여러 개 받아 출력을 만드는데, 이대 입력 값에 가중치를 조절할 수 있게 만들어 최초로 ‘학습’을 하게 했음3년 후, 여기에 앞 장에서 다른 경사 하강법을 도입해 최적의 경계선을 그릴 수 있게 한 아달라인(Adaline)이 개발아달라인 이후 서포트 벡터 머신 등 머신 러닝의 중요한 알고리즙들로 발전해 가는데, 이 중 시그모이드를 활성화 함수로 사용한..

로지스틱 회귀

2024.07.17·빅데이터 분석가 양성과정/Python - 딥러닝

예측선(판단 기준)을 직선으로 표현하는 것이 적절하지 않은 경우가 있음위의 데이터 같은 경우 s자 형태의 곡선이어야 한다. 시그모이드 함수 # 1. 환경 준비import numpy as npimport matplotlib.pyplot as pltfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense# 2. 데이터 준비x = np.array([2, 4, 6, 8, 10, 12, 14])y = np.array([0, 0, 0, 1, 1, 1, 1])# 3. 모델 구조 결정model = Sequential()# 입력이 하나 출력도 하나인 모델 / 활성화 함수는 시그모이드model.add(Dense(1, inp..

선형회귀

2024.07.17·빅데이터 분석가 양성과정/Python - 딥러닝

선형회귀단순 선형 회귀(simple linear regression)독립 변수 x(‘정보’) 하나로 종속 변수 y 값을 예측할 수 있는 경우의 분석 작업코드 import numpy as npimport matplotlib.pyplot as pltX = np.array([2, 4, 6, 8])Y = np.array([81, 93, 91, 97])plt.plot(X,Y,'o')plt.xlabel('study time')plt.title('Jumsu vs. study time')plt.grid()$y=ax+b$를 결정하기 위해 기울기 a와 절편 b값은 최소제곱법으로 구할 수 있음 주어진 표에 제시한 테이터를 기반으로 예측선을 만들려고 한다계산결과 : a=2.3, b=79.0# 공부한 시간과 점수를 각각 x, ..

딥러닝을 위한 기초 수학

2024.07.17·빅데이터 분석가 양성과정/Python - 딥러닝

함수두 집합 사이의 관계를 설명하는 수학 개념변수 x가 있을 때 x가 변하면 이에 따라 y는 어떤 규칙으로 변하는지 나타냄 일차함수 ( 기울기와 절편 )일차 함수 : y가 x에 관한 1차식으로 표현된 함수를 말함ex ) $y = ax + b , ( a ≠ 0 )$실습 코드# 1차 함수# 1차 함수, 𝒚=𝒂𝒙+𝒃 (𝒂≠𝟎)에서 𝒂=𝟏, 𝒃=𝟐일 때 𝒚의 그래프를 그리시오import numpy as npimport matplotlib.pyplot as pltx = np.linspace(-4, 4, 100)a = 1b = 2y = a * x + bplt.plot(x,y)plt.grid()plt.title('$f(x)=x+2$')plt.show() import numpy as npimpor..

개요

2024.07.17·빅데이터 분석가 양성과정/Python - 딥러닝

인공지능의 개요사람과 같은 지능을 구현하기 위한 시스템이나 프로그램강 인공지능 : 사람과 구분이 안 될 정도로 강한 인공지능 - 아이언맨의 자비스약 인공지능 : 특정 영역에서 작업을 수행하는 인공지능 - 테슬라의 자율 주행 딥러닝의 개요머신러닝 알고리즘 중 하나인 인공신경망(artificial neural network)으로 만든 것 코드numpy 기초 세팅import numpy as np 배열 생성my_arr = np.array([1, 2, 3])print(my_arr)[ 1 2 3 ]my_arr = np.array([[10, 20, 30], [40, 50, 60]])print(my_arr)[[10 20 30][40 50 60]]type(my_arr)numpy.ndarray 배열 수정x = [-3, 3..

Ecommerce Machine Learning - 프로모션 효율 예측 (Random Forest)

2024.07.12·빅데이터 분석가 양성과정/Python - 머신러닝

데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsmem = pd.read_csv('member.csv')tran = pd.read_csv('transaction.csv')mem.head()mem.info()mem.describe()tran.head()tran.info()tran.describe()평균 추가 및 데이터 합치기tran['avg_price'] = tran['total_amount'] / tran['num_item']tran데이터 합치기# Groupby를 활용하여 id별 1줄로 데이터 요약tran_mean = tran.groupby('id').mean()tran_mean# I..

Ecommerce Machine Learning - 구매 요인 분석 ( Decision Tree)

2024.07.12·빅데이터 분석가 양성과정/Python - 머신러닝

데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('galaxy.csv')data.head()data.info()data.describe() sns.distplot(data['startprice'])sns.distplot(data['charCountDescription'])plt.figure(figsize=(20, 10))sns.boxplot(x='productline', y='startprice', data = data) 결측값 처리data.isna().sum() / len(data)data.head()# 결측값 대체data = data.fillna(..

Ecommerce Machine Learning - 고객 이탈 예측(KNN)

2024.07.12·빅데이터 분석가 양성과정/Python - 머신러닝

데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('churn.csv')data# 출력하는 열 개수 지정pd.set_option('display.max_columns', 30)# 출력하는 행 개수 지정pd.set_option('display.max_rows', 100)data.info()# 공백 문자열을 NaN으로 변경하기data['TotalCharges'] = data['TotalCharges'].replace(" ", np.nan)# or# data['TotalCharges'] = data['TotalCharges'].replace(" ", "")#..

Ecommerce Machine Learning - 광고 반응률 예측(로지스틱 회귀)

2024.07.12·빅데이터 분석가 양성과정/Python - 머신러닝

데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('advertising.csv')datadata.info()sns.distplot(data['Area Income'])sns.distplot(data['Age'])# 텍스트로 된 컬럼 확인data['Country'].nunique() # 237data['City'].nunique() # 969data['Ad Topic Line'].nunique() # 1000 결측값 확인 및 처리# 결측값 확인 및 처리data.isna().sum() / len(data)data..

티스토리툴바