파이썬 이미지 크롤링 관련 질문.. :: 2cpu, 지름이 시작되는 곳!

쓰기

파이썬 이미지 크롤링 관련 질문..

눌눌2

2023-06

2023-06-16 12:00:01

지금 4일째 끙끙대고 있습니다...

네이버스마트스토어(https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW)

여기에서 리뷰들의 이미지만 따로 추출해서 로컬 컴퓨터에 저장하고싶어서 코드를 짰습니다.

import os

import requests

from bs4 import BeautifulSoup

url = "https://smartstore.naver.com/bebenuvo/products/4922209638#REVIEW"

response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

review_image_urls = []

#여기부분을 어떻게 잡아야할지 모르겠습니다.

for img_item in soup.select(".review-section img"):

review_image_urls.append(img_item["src"])

save_path = "c;/work"

if not os.path.exists(save_path):

os.makedirs(save_path)

# 순서대로 이미지 저장

for idx, image_url in enumerate(review_image_urls):

response = requests.get(image_url)

# 확장자 추출

file_ext = os.path.splitext(image_url)[1]

# 파일명 설정 및 저장

file_name = f"{save_path}/review_image_{idx+1}{file_ext}"

with open(file_name, "wb") as f:

f.write(response.content)

print("스마트스토어 이미지 저장완료")

리뷰들 이미지 처음페이지부터 마지막 페이지까지 몇천개가 되는 이미지를 모두 다운 받으려면 어떤식으로 변경하거나 다시 짜야할까요??

짧은글 일수록 신중하게.



눌눌2 2023-06 너무 많이 고민하다가 안돼서 여러분께 도움을 청하고자 올려봅니다 너무 많이 고민하다가 안돼서 여러분께 도움을 청하고자 올려봅니다



Wheein 2023-06 https://smartstore.naver.com/i/v1/reviews/paged-reviews 상품 페이지에서 요 API 를 호출해서 리뷰 목록 & 이미지 주소를 얻어오는 것 같은데, 페이지를 크롤링하시기보다는 위의 API 를 직접 호출해서 URL 뽑아보시는건 어떨까요? https://smartstore.naver.com/i/v1/reviews/paged-reviews 상품 페이지에서 요 API 를 호출해서 리뷰 목록 & 이미지 주소를 얻어오는 것 같은데, 페이지를 크롤링하시기보다는 위의 API 를 직접 호출해서 URL 뽑아보시는건 어떨까요?

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

288/5713

번호	제목Page 288/5713	글쓴이	날짜	조회	추천
	[필독] 처음 오시는 분을 위한 안내 (735)	정은준1	2014-05	5181101	0
[필독] 처음 오시는 분을 위한 안내 (735) 2014-05 5181101 1 정은준1
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1714553	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1714553 1 백메가
108511	인천 서구/계양구 쪽에 피부과 추천좀.. (2)	무아	2023-07	1412	0
인천 서구/계양구 쪽에 피부과 추천좀.. (2) 2023-07 1412 1 무아
108510	사파이어 래피즈 추가 연기 뉴스의 출처는 ?? (7)	박문형	2023-07	1841	0
사파이어 래피즈 추가 연기 뉴스의 출처는… (7) 2023-07 1841 1 박문형
108509	자료의 보관을 위해 어느정도 까지 대비하시나요? (13)	정무현	2023-07	2902	0
자료의 보관을 위해 어느정도 까지 대비하… (13) 2023-07 2902 1 정무현
108508	[질문] 비주얼베이직이다 비주얼스튜디오 공부를 했던거같던데 요즘 사용안하나요? (11)	키리에	2023-07	2505	0
[질문] 비주얼베이직이다 비주얼스튜디오 … (11) 2023-07 2505 1 키리에
108507	[해결]윈도우10 23년 7월 11일자 업데이트후 랜카드 오류 (4)	김황중	2023-07	2683	0
[해결]윈도우10 23년 7월 11일자 업데이트… (4) 2023-07 2683 1 김황중
108506	인텔® 제온® Silver 4410T 2.70GHz 이 cpu는 워크스테이션용? (15)	김황중	2023-07	3191	0
인텔® 제온® Silver 4410T 2.70GHz 이 cpu… (15) 2023-07 3191 1 김황중
108505	헤놀로지와 PC 에서 SMB 설정 문의 드려요. (10)	죠슈아	2023-07	2641	0
헤놀로지와 PC 에서 SMB 설정 문의 드려… (10) 2023-07 2641 1 죠슈아
108504	win 서버 원격 접속을 해도, 해당 서버 작업을 불러올 수 가 없습니다. (2)	Dante0001	2023-07	1356	0
win 서버 원격 접속을 해도, 해당 서버 작… (2) 2023-07 1356 1 Dante0001
108503	KT 공유기를 통한 서버 접속 (3)	프랑	2023-07	2303	0
KT 공유기를 통한 서버 접속 (3) 2023-07 2303 1 프랑
108502	HITACHI (HGST) SAS HDD 펌웨어 업데이트 방법 문의드립니다. (1)	김형준1	2023-07	1678	0
HITACHI (HGST) SAS HDD 펌웨어 업데이트 … (1) 2023-07 1678 1 김형준1
108501	이 동네에 CAD로 그림 그리시는분 꽤 계시는거 같은데 램 드라이브는 효과 없나요? (5)	막울었어요	2023-07	1798	0
이 동네에 CAD로 그림 그리시는분 꽤 계시… (5) 2023-07 1798 1 막울었어요
108500	포티넷 fg-200e 부팅 에러 관련 수리문의 (9)	듀학	2023-07	1947	0
포티넷 fg-200e 부팅 에러 관련 수리문의 (9) 2023-07 1947 1 듀학
108499	사내 윈도우즈 exe 프로그램을 웹에서도 사용할 수 있을까요? (8)	drama	2023-07	1352	0
사내 윈도우즈 exe 프로그램을 웹에서도 … (8) 2023-07 1352 1 drama
108498	[고수님들 부탁드려요]하드도킹기 추천해주실만한거 있으실까요 용량은 12tb까지 쓸… (6)	지존터미네…	2023-07	1522	0
[고수님들 부탁드려요]하드도킹기 추천해… (6) 2023-07 1522 1 지존터미네…
108497	콘덴서 관련 문의 드립니다 (6)	김병일	2023-07	1456	0
콘덴서 관련 문의 드립니다 (6) 2023-07 1456 1 김병일
108496	cpu 코어가 줄어들면 전력소모도 줄어드나요? (8)	이매망량2	2023-07	4789	0
cpu 코어가 줄어들면 전력소모도 줄어드나… (8) 2023-07 4789 1 이매망량2
108495	나스에서 나스로 이동중인데 1gb/s도 안나옵니다 (26)	이매망량2	2023-07	2907	0
나스에서 나스로 이동중인데 1gb/s도 안나… (26) 2023-07 2907 1 이매망량2
108494	제온 2969 v3 터보언락 나스에서도 작동 하나요? (9)	julius3637	2023-07	2453	0
제온 2969 v3 터보언락 나스에서도 작동 … (9) 2023-07 2453 1 julius3637
108493	팀뷰어 라이센스 문제 (5)	먹짱이	2023-07	2331	0
팀뷰어 라이센스 문제 (5) 2023-07 2331 1 먹짱이
108492	키보드 자음 모음 분리현상 질문입니다 ㅠㅠ (15)	회원	2023-07	3343	0
키보드 자음 모음 분리현상 질문입니다 ㅠㅠ (15) 2023-07 3343 1 회원