Scatterplotlineplot과 비슷하게 x, y에 대한 전체적인 분포를 확인하는 plot.lineplot은 경향성에 초점을 둔다면, scatterplot은 데이터 그 자체가 퍼져있는 모양에 중점을 둡니다.# penguin 데이터에 scatterplot을 출력합니다.#sns.scatterplot(data=penguins, x="body_mass_g", y="flipper_length_mm", hue="species")sns.scatterplot(data=penguins, x="bill_length_mm", y="bill_depth_mm", hue="sex")
Pointplot특정 수치 데이터를 error bar와 함께 출력해주는 plot.수치 데이터를 다양한 각도에서 한 번에 바라보고 싶을 때 사용합니다.데이터와 error bar를 한 번에 찍어주기 때문에, 살펴보고 싶은 특정 지표들만 사용하는 것이 좋습니다.# penguin 데이터에 pointplot을 출력합니다.#sns.pointplot(data=penguins, y="flipper_length_mm", x="sex", hue="species")sns.pointplot(data=penguins, y="bill_length_mm", x="sex", hue="species")
개요EDA(Exploratory Data Analysis)는 데이터를 탐색하고 이해하는 과정입니다. 목적데이터의 구조 및 특성 이해하기데이터의 크기, 변수의 종류, 결측값 등을 파악하여 데이터를 이해변수 간 관계, 상관관계, 분포 등을 파악데이터 품질 평가하기이상치, 편향, 오류 등을 식별하여 데이터의 품질을 확인가설 생성 및 검증하기데이터 분석을 위한 가설을 수립하고 검증데이터 기반의 통찰을 얻어 문제 해결을 위한 방향 설정모델링을 위한 데이터 준비데이터 변환, 특성 엔지니어링 등 모델링에 적합한 데이터 준비 주로 사용되는 기술기술 통계량 분석(평균, 중앙값, 표준편차 등)시각화(히스토그램, 산점도, 상관관계 매트릭스 등)결측값 처리, 이상치 탐지변수 간 관계 분석(상관관계, 교차분석 등) 결론이를 ..
개요제조 프로세스에서 문제 발생을 신속하게 감지하고 대응하기 위한 시각적 관리 시스템입니다. 주요 특징 1. 시각적 표시등 시스템:생산 라인의 각 공정 상태를 신호등 형태로 표시녹색, 황색, 적색 등의 색상으로 정상 가동, 주의 필요, 문제 발생 등을 표시즉각적인 문제 알림:문제 발생 시 작업자나 관리자에게 즉시 알림소리 신호, 알람, 메시지 전송 등을 통해 신속한 대응 가능문제 원인 분석 및 해결:문제 발생 지점, 시간, 유형 등의 데이터 수집데이터 분석을 통해 근본 원인 파악 및 해결책 도출지속적인 프로세스 개선:문제 발생 데이터 축적 및 분석개선 활동을 통해 생산성과 품질 향상 적용 사례도요타 생산 시스템으로 사용중이며,신속한 문제 감지와 해결을 통해 제조 프로세스의 안정성과 효율성을 높이는 데 기..
Lineplot특정 데이터를 x, y로 표시하여 관계를 확인할 수 있는 plot. (선 그래프)수치형 지표들 간의 경향을 파악할 때 많이 사용합니다.# penguin 데이터에 lineplot을 출력합니다.#sns.lineplot(data=penguins, x="body_mass_g", y="flipper_length_mm", hue="species")#sns.lineplot(data=penguins, y="body_mass_g", x="flipper_length_mm", hue="sex")sns.lineplot(data=penguins, y="bill_length_mm", x="bill_depth_mm", hue="species")
Violinplot데이터에 대한 분포 자체를 보여주는 plot.boxplot과 비슷하지만, 전체 분포에 대한 그림을 보여준다는 점에서 boxplot과 다릅니다.보통 boxplot과 함께 표시하면, 평균 근처에 데이터가 얼마나 있는지(boxplot) 전체적으로 어떻게 퍼져있는지(violinplot) 모두 확인이 가능합니다.# penguin 데이터에 violinplot을 출력합니다.#sns.violinplot(data=penguins, y="flipper_length_mm", x="species", hue="species")sns.violinplot(data=penguins, y="body_mass_g", x="species", hue="sex")