티스토리 뷰
import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
import time
# url = input("크롤링할 URL을 기입하거라")
# url = "http://mulamen.com/shop/shopdetail.html?branduid=10182780&xcode=006&mcode=002&scode=&type=Y&sort=manual&cur_code=006002&GfDT=bG13VQ%3D%3D"
url = "https://mulamen.com/shop/shopdetail.html?branduid=10182737&xcode=008&mcode=001&scode=&type=Y&sort=manual&cur_code=008001&GfDT=bm1%2FW10%3D"
driver = webdriver.Chrome('내 드라이버 경로')
driver.implicitly_wait(1)
driver.get(url)
driver.implicitly_wait(1)
url_review = driver.find_element_by_xpath('//*[@id="crema-product-reviews-1"]')
url_review_source = url_review.get_attribute('src')
driver.get(url_review_source)
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')
reviews = []
while True:
try:
reviewArray = soup.find_all("div", {"class" : "review_message review_message--collapsed review_message--collapsed3 js-translate-review-message"})
for data in reviewArray:
reviews.append(data.get_text())
temp = reviewArray
next_page_btn = driver.find_element_by_xpath('//*[@id="content"]/div/div[3]/div[3]/div/div/a[last()]').click()
time.sleep(1)
driver.get(driver.current_url)
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')
except:
print("리뷰수집끝남")
break
print(len(reviews))
df = pd.DataFrame({'Review' : reviews})
df = df.replace('\n', ' ', regex=True)
df.to_csv('Reviews.csv')
셀레니움이용해서, 버튼이 더이상 눌리지 않을 때까지 계속 버튼을 누르는 방식으로 해결
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- TypeScript
- npm
- 중간거리 #야만나 #약속장소추천 #중간위치 #웹 #리액트 #React #reactjs #kakao지도 #kakaoapi
- 1992번
- 쿼드트리
- javascript #백준 #회의실배정 #알고리즘
- 알고리즘
- java #백준 #알고리즘 #로또 #6603
- Javascript
- javascript #연속합 #알고리즘 #백준
- java #오르막수 #백준 #알고리즘
- java #하노이 #알고리즘 #백준
- javascript #백준 #알고리즘 #LCS
- java #퀵소트 #quicksort #알고리즘 #백준
- webspider
- java #알고리즘 #백준 #N과M #백트래킹
- webpack
- java #알고리즘 #백준
- java #알고리즘 #백준 #퇴사
- 2630번
- Terminal
- 한글 자동 완성
- java #백준 #알고리즘 #2805 #나무자르기
- java #알고리즘 #백준 #패션왕신해빈
- react
- 백준 #알고리즘 #전깃줄 #NodeJs #javascript
- 색종이자르기
- Game
- 백준
- 백준 #java #알고리즘
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함