https://finance.naver.com/marketindex/index.naver환전 고시 환율 2024.07.09 10:11 하나은행 기준 고시회차 91회finance.naver.com환율 가져오기import urllib.request as requestfrom bs4 import BeautifulSoupurl = ''html = request.urlopen(url)soup = BeautifulSoup(html, 'html.parser')ul_tag = soup.find(id = "exchangeList")li_tag = ul_tag.find('li', {'class':'on'})a_tag = li_tag.find('a')div_tag = a_tag.find('div', {'class':'hea..
빅데이터 분석가 양성과정
소녀나라 - 아우터디자인하는 즐거움, 아키랩. 우리의 실험실은 아무것도 없는 곳에 무언가를 넣어 시간과 공간을 만드는 즐거움입니다. 오늘 하루 열지 않기 닫기sonyunara.comimport requestsfrom bs4 import BeautifulSoupresult = requests.get('')soup = BeautifulSoup(result.content, 'html.parser') 상품 이름 가져오기names = soup.findAll('div',{'class':'subject'})names[0].find('a')[SET] 모던 자켓 스커트 투피스 셋업print(len(names))print(names)for name in names: print(name.find('a').text)[S..
ID로 특정 요소 찾기 : find()from bs4 import BeautifulSouphtml = """ 스크래핑이란 첫 번째 문단 시작 - 끝 두 번째 문단 시작 - 끝 인공지능이란? 세 번쨰 문단 시작 - 끝 네 번째 문단 시작 - 끝"""soup = BeautifulSoup(html, 'html.parser')title_1 = soup.find(id = 'title1')print(title_1.text)print(title_1.string)스크래핑이란 스크래핑이란result = soup.find(id = 'paragraph_3')result.text세 번쨰 문단 시작 - 끝 CLASS로 특정 요소 찾기 : find()find('tag', {'class':'n..
가볍게 살펴보기from bs4 import BeautifulSouphtml = """ 크롤링 웹 페잊 분석 원 하는 내용 추출 """soup = BeautifulSoup(html, 'html.parser')h1 = soup.html.body.h1p1 = soup.html.body.pp2 = p1.next_sibling.next_siblingprint('h1 = ', h1.string)print('p = ', p1.string)print('p = ', p2.string)h1 = 크롤링p = 웹 페이지 분석p = 원 하는 내용 추출from bs4 import BeautifulSouphtml = """ hello..
11. 상관관계를 확인하기 위해 주로 사용되는 그래프 타입 feature 간의 연관 관계 분석주요 그래프 타입heatmap 그래프산점도(scatter) 그래프 11.1. Heatmap 그래프import chart_studio.plotly as pyimport cufflinks as cfcf.go_offline(connected=True)import pandas as pddoc = pd.read_csv("COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports/04-01-2020.csv", encoding='utf-8-sidoc.corr()iplot 으로 그려보기doc2.iplot(kind='heatmap')cf.help('heatmap')cf.col..
8. 테이블 데이터와 시계열 데이터테이블 데이터 : 엑셀과 같이 행과 열로 나타낸 데이터feature: 테이블의 각 열을 의미record: 테이블의 각 행을 의미index: 각 데이터 위치를 식별하기 위한 값시계열 데이터: 일정 시간 간격으로 배치된 데이터 (시간에 종속된 데이터)이외에도 다양한 형태의 데이터가 있을 수 있으나, 대부분 테이블 데이터 형태로 처리 가능 9. 시계열 데이터 시각화를 위한 사전 준비pd.date_range(start='2020-01-01', end='2020-12-31')freq='3M': 3개월freq='D': 1일periods=10: start와 end 사이 균등 시간 분할참고: https://pandas.pydata.org/pandasdocs/stable/referenc..