파이썬 이미지 크롤링 관련 질문..

눌눌2   
   조회 2053   추천 0    

https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW (1933)

지금 4일째 끙끙대고 있습니다...

네이버스마트스토어(https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW)


여기에서 리뷰들의 이미지만 따로 추출해서 로컬 컴퓨터에 저장하고싶어서 코드를 짰습니다. 



import os

import requests

from bs4 import BeautifulSoup


url = "https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")


review_image_urls = []


#여기부분을 어떻게 잡아야할지 모르겠습니다. 

for img_item in soup.select(".review-section img"):

    review_image_urls.append(img_item["src"])



save_path = "c;/work"

if not os.path.exists(save_path):

    os.makedirs(save_path)


# 순서대로 이미지 저장

for idx, image_url in enumerate(review_image_urls):

    response = requests.get(image_url)


    # 확장자 추출

    file_ext = os.path.splitext(image_url)[1]


    # 파일명 설정 및 저장

    file_name = f"{save_path}/review_image_{idx+1}{file_ext}"

    with open(file_name, "wb") as f:

        f.write(response.content)


print("스마트스토어 이미지 저장완료")


리뷰들 이미지 처음페이지부터 마지막 페이지까지 몇천개가 되는 이미지를 모두 다운 받으려면 어떤식으로 변경하거나 다시 짜야할까요??

짧은글 일수록 신중하게.
눌눌2 2023-06
너무 많이 고민하다가 안돼서 여러분께 도움을 청하고자 올려봅니다
Wheein 2023-06
https://smartstore.naver.com/i/v1/reviews/paged-reviews
상품 페이지에서 요 API 를 호출해서 리뷰 목록 & 이미지 주소를 얻어오는 것 같은데, 페이지를 크롤링하시기보다는 위의 API 를 직접 호출해서 URL 뽑아보시는건 어떨까요?


QnA
제목Page 288/5713
2014-05   5181101   정은준1
2015-12   1714553   백메가
2023-07   1412   무아
2023-07   1841   박문형
2023-07   2902   정무현
2023-07   2505   키리에
2023-07   2683   김황중
2023-07   3191   김황중
2023-07   2641   죠슈아
2023-07   1356   Dante0001
2023-07   2303   프랑
2023-07   1678   김형준1
2023-07   1798   막울었어요
2023-07   1947   듀학
2023-07   1352   drama
2023-07   1522   지존터미네…
2023-07   1456   김병일
2023-07   4789   이매망량2
2023-07   2907   이매망량2
2023-07   2453   julius3637
2023-07   2331   먹짱이
2023-07   3343   회원