함수두 집합 사이의 관계를 설명하는 수학 개념변수 x가 있을 때 x가 변하면 이에 따라 y는 어떤 규칙으로 변하는지 나타냄 일차함수 ( 기울기와 절편 )일차 함수 : y가 x에 관한 1차식으로 표현된 함수를 말함ex ) $y = ax + b , ( a ≠ 0 )$실습 코드# 1차 함수# 1차 함수, 𝒚=𝒂𝒙+𝒃 (𝒂≠𝟎)에서 𝒂=𝟏, 𝒃=𝟐일 때 𝒚의 그래프를 그리시오import numpy as npimport matplotlib.pyplot as pltx = np.linspace(-4, 4, 100)a = 1b = 2y = a * x + bplt.plot(x,y)plt.grid()plt.title('$f(x)=x+2$')plt.show() import numpy as npimpor..
빅데이터 분석가 양성과정
인공지능의 개요사람과 같은 지능을 구현하기 위한 시스템이나 프로그램강 인공지능 : 사람과 구분이 안 될 정도로 강한 인공지능 - 아이언맨의 자비스약 인공지능 : 특정 영역에서 작업을 수행하는 인공지능 - 테슬라의 자율 주행 딥러닝의 개요머신러닝 알고리즘 중 하나인 인공신경망(artificial neural network)으로 만든 것 코드numpy 기초 세팅import numpy as np 배열 생성my_arr = np.array([1, 2, 3])print(my_arr)[ 1 2 3 ]my_arr = np.array([[10, 20, 30], [40, 50, 60]])print(my_arr)[[10 20 30][40 50 60]]type(my_arr)numpy.ndarray 배열 수정x = [-3, 3..
데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsmem = pd.read_csv('member.csv')tran = pd.read_csv('transaction.csv')mem.head()mem.info()mem.describe()tran.head()tran.info()tran.describe()평균 추가 및 데이터 합치기tran['avg_price'] = tran['total_amount'] / tran['num_item']tran데이터 합치기# Groupby를 활용하여 id별 1줄로 데이터 요약tran_mean = tran.groupby('id').mean()tran_mean# I..
데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('galaxy.csv')data.head()data.info()data.describe() sns.distplot(data['startprice'])sns.distplot(data['charCountDescription'])plt.figure(figsize=(20, 10))sns.boxplot(x='productline', y='startprice', data = data) 결측값 처리data.isna().sum() / len(data)data.head()# 결측값 대체data = data.fillna(..
데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('churn.csv')data# 출력하는 열 개수 지정pd.set_option('display.max_columns', 30)# 출력하는 행 개수 지정pd.set_option('display.max_rows', 100)data.info()# 공백 문자열을 NaN으로 변경하기data['TotalCharges'] = data['TotalCharges'].replace(" ", np.nan)# or# data['TotalCharges'] = data['TotalCharges'].replace(" ", "")#..
데이터 확인import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsdata = pd.read_csv('advertising.csv')datadata.info()sns.distplot(data['Area Income'])sns.distplot(data['Age'])# 텍스트로 된 컬럼 확인data['Country'].nunique() # 237data['City'].nunique() # 969data['Ad Topic Line'].nunique() # 1000 결측값 확인 및 처리# 결측값 확인 및 처리data.isna().sum() / len(data)data..