Web Crawling - 옷 쇼핑몰

2024. 7. 9. 10:12·빅데이터 분석가 양성과정/Python
목차
  1. 상품 이름 가져오기
  2. 상품 가격 가져오기
  3. 상품 이름/가격 한번에 가져오기
  4. 아우터 페이지 메뉴 글 추출
  5. 메인 페이지 menu 가져오기

 

 

소녀나라 - 아우터

디자인하는 즐거움, 아키랩. 우리의 실험실은 아무것도 없는 곳에 무언가를 넣어 시간과 공간을 만드는 즐거움입니다. 오늘 하루 열지 않기 닫기

sonyunara.com


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/shop/list.php?page=1&cate=0104&limit=60>')
soup = BeautifulSoup(result.content, 'html.parser')

 

상품 이름 가져오기


      
names = soup.findAll('div',{'class':'subject'})
names[0].find('a')

<a href="/shop/view.php?index_no=460853">[SET] 모던 자켓 스커트 투피스 셋업</a>


      
print(len(names))
print(names)


      
for name in names:
print(name.find('a').text)

[SET] 에디트 싱글 트렌치 스트랩 롱코트 (하트단추!)토피 트위드 반팔 자켓 린더 배색 하프 슬리브 트위드 자켓 여리무드 가득♥ 썸머 린넨 니트 가디건 셋업 자켓 플리츠 스커트 세트 로나 셔링 크롭 벌룬 퍼프 숏자켓 [단독특가/자체제작]프리미엄 빵빵숏패딩(9colors!) 에딘 박시핏 바스락 하이넥 윈드브레이커 퍼미션 투포켓 데님 자켓 그랑데 배색 투웨이 바시티 자켓

 

상품 가격 가져오기


      
products = soup.findAll('div',{'class':'item-content'})
products[0].findAll('div', {'class':'info'})

[<div class="info"> <div class="pull-left"></div> </div>, <div class="info"> <div class="pull-left"> <span>23<em>%</em></span> <span>40,900</span> </div> </div>]


      
div_tags = products[0].findAll('div',{'class':'info'}) # info가 두개
div_tags[1].findAll('span') #두번째거니까 [1]

[<span>23<em>%</em></span>, <span>40,900</span>]


      
div_tags[1].findAll('span')[1].text

40,900


      
price = div_tags[1].findAll('span')[1].text
int(price.replace(',', ''))

40900

 

상품 이름/가격 한번에 가져오기


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/shop/list.php?page=1&cate=0104&limit=60>')
soup = BeautifulSoup(result.content, 'html.parser')
for product in products:
print(product.find('div',{'class':'subject'}).find('a').text, end=':')
print(product.findAll('div',{'class':'info'})[1].findAll('span')[1].text)

[단독특가/자체제작]프리미엄 빵빵숏패딩(9colors!):51,800

에딘 박시핏 바스락 하이넥 윈드브레이커:34,400

퍼미션 투포켓 데님 자켓:29,800

그랑데 배색 투웨이 바시티 자켓:51,800

 

아우터 페이지 메뉴 글 추출


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/shop/list.php?cate=0104>')
soup = BeautifulSoup(result.content, 'html.parser')
cate = soup.find('ul',{'class':'tabmenu'})
li_tags = cate.findAll('li')
for c in li_tags:
print(c.find('a').text)

All

가디건

자켓

베스트

코트

집업.점퍼

플리스

패딩

 

메인 페이지 menu 가져오기


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/>')
soup = BeautifulSoup(result.content, 'html.parser')
li_tags = soup.select('nav#gnb > ul.menu > li > a ')
for li_tag in li_tags:
print(li_tag.text)

베스트

아우터

상의

셔츠/블라우스

트레이닝

베이직

원피스

스커트

팬츠

가방

신발

액세서리


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/>')
soup = BeautifulSoup(result.content, 'html.parser')
li_tags = soup.select('#gnb > ul.menu > li ')
for li_tag in li_tags:
l = li_tag.select_one('li:nth-child(n)>a')
print(l.text)

베스트

아우터

상의

셔츠/블라우스

트레이닝

베이직

원피스

스커트

팬츠

가방

신발

액세서리

 


      
import requests
from bs4 import BeautifulSoup
result = requests.get('<https://sonyunara.com/>')
soup = BeautifulSoup(result.content, 'html.parser')
li_tags = soup.select('#gnb > ul.menu > li ')
for li_tag in li_tags:
l = li_tag.find('a')
print(l.text)

베스트

아우터

상의

셔츠/블라우스

트레이닝

베이직

원피스

스커트

팬츠

가방

신발

액세서리

 

'빅데이터 분석가 양성과정 > Python' 카테고리의 다른 글

Numpy ( 1 )  (0) 2024.07.09
Web Crawling - 네이버 금융 환율정보 / 시 / 블로그 / 뉴스  (2) 2024.07.09
Web Crawling - find()  (0) 2024.07.09
Web Crawling - 기초  (0) 2024.07.09
시각화 이용한 탐색적 데이터 분석(6)  (1) 2024.07.08
  1. 상품 이름 가져오기
  2. 상품 가격 가져오기
  3. 상품 이름/가격 한번에 가져오기
  4. 아우터 페이지 메뉴 글 추출
  5. 메인 페이지 menu 가져오기
'빅데이터 분석가 양성과정/Python' 카테고리의 다른 글
  • Numpy ( 1 )
  • Web Crawling - 네이버 금융 환율정보 / 시 / 블로그 / 뉴스
  • Web Crawling - find()
  • Web Crawling - 기초
황규진
황규진
글쓰기 관리
황규진
Data Analyst Hwang
홈
|
로그인

  • 노션 포트폴리오
  • 전체 글 (549)
    • 코드 및 쿼리문 (134)
      • 코드 정리 (10)
      • SQL 공부 (116)
      • 강의 - 메타코드M (8)
    • 개인 활동 (35)
      • Tableau Bootcamp (6)
      • 현직자 특강 & 인터뷰 (4)
      • 직무 공부 (22)
      • 독서 (2)
      • 근황 공유 (1)
    • 자격증 (7)
      • 빅데이터분석기사 (1)
      • 정보처리기사 (1)
      • 경영정보시각화 (1)
      • SQL개발자(SQLD) (1)
      • 데이터 분석 준전문가(ADsP) (1)
      • 통계적품질관리(SPC) (1)
      • AICE Associate (1)
    • 취업사관학교 9기 (199)
      • 모닝스쿨 (54)
      • 스스로 모닝스쿨 (125)
      • 직무 스터디 (20)
      • 반성과 다짐 (0)
    • 빅데이터 분석가 양성과정 (174)
      • Python (88)
      • Python - 머신러닝 (26)
      • Python - 딥러닝 (32)
      • PyQt (4)
      • JavaScript (10)
      • MySQL (13)
      • Node.js (1)
hELLO· Designed By정상우.v4.6.1
황규진
Web Crawling - 옷 쇼핑몰
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.