ÆÄÀ̽ã À̹ÌÁö Å©·Ñ¸µ °ü·Ã Áú¹®..

´­´­2   
   Á¶È¸ 1643   Ãßõ 0    

https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW (1904)

지금 4일째 끙끙대고 있습니다...

네이버스마트스토어(https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW)


여기에서 리뷰들의 이미지만 따로 추출해서 로컬 컴퓨터에 저장하고싶어서 코드를 짰습니다. 



import os

import requests

from bs4 import BeautifulSoup


url = "https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")


review_image_urls = []


#여기부분을 어떻게 잡아야할지 모르겠습니다. 

for img_item in soup.select(".review-section img"):

    review_image_urls.append(img_item["src"])



save_path = "c;/work"

if not os.path.exists(save_path):

    os.makedirs(save_path)


# 순서대로 이미지 저장

for idx, image_url in enumerate(review_image_urls):

    response = requests.get(image_url)


    # 확장자 추출

    file_ext = os.path.splitext(image_url)[1]


    # 파일명 설정 및 저장

    file_name = f"{save_path}/review_image_{idx+1}{file_ext}"

    with open(file_name, "wb") as f:

        f.write(response.content)


print("스마트스토어 이미지 저장완료")


리뷰들 이미지 처음페이지부터 마지막 페이지까지 몇천개가 되는 이미지를 모두 다운 받으려면 어떤식으로 변경하거나 다시 짜야할까요??

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
´­´­2 2023-06
³Ê¹« ¸¹ÀÌ °í¹ÎÇÏ´Ù°¡ ¾ÈµÅ¼­ ¿©·¯ºÐ²² µµ¿òÀ» ûÇÏ°íÀÚ ¿Ã·Áº¾´Ï´Ù
Wheein 2023-06
https://smartstore.naver.com/i/v1/reviews/paged-reviews
»óÇ° ÆäÀÌÁö¿¡¼­ ¿ä API ¸¦ È£ÃâÇؼ­ ¸®ºä ¸ñ·Ï & À̹ÌÁö ÁÖ¼Ò¸¦ ¾ò¾î¿À´Â °Í °°Àºµ¥, ÆäÀÌÁö¸¦ Å©·Ñ¸µÇϽñ⺸´Ù´Â À§ÀÇ API ¸¦ Á÷Á¢ È£ÃâÇؼ­ URL »Ì¾Æº¸½Ã´Â°Ç ¾î¶³±î¿ä?


QnA
Á¦¸ñPage 277/5696
2014-05   5030100   Á¤ÀºÁØ1
2015-12   1566647   ¹é¸Þ°¡
2021-10   1641   °í¾ç½Ã
2021-12   1641   lovei
03-02   1641   ¶ó¿ÂÁ¦³ª
2023-02   1641   ÇÑÈ¿¼®
2023-03   1641   twopaik
2023-11   1641   inquisitive
2022-02   1641   ÇÁ¶û
2023-03   1641   ¹Ì´ã
2023-01   1641   ÇູÇϼ¼
03-23   1642   ¸Ó¶óÄ«´Âµ¥
2022-07   1642   ¹Ì¼ö¸Ç
2022-01   1642   L2½ºÀ§Ä¡
2022-03   1642   ¸¶Áö¸·¼¼´ë
06-26   1642   Skyhard
05-05   1642   sdlfkjwer
2021-10   1642   ¾ç½Ã¿­
07-01   1642   ¿©ÁÖ³ó¹Î76
2022-05   1642   ±¸Â÷´Ï
2022-09   1642   kino0924
2023-04   1642   º¸½½ºñ³»¸®¡¦