가령 a.com이라는 도메인을 가진 어떤 웹사이트로 접속하면 apache 디렉토리 리스팅이 뜹니다.
상위폴더, 하위폴더 이동이 자유로운 페이지인데요.
(사실상 취약점인데 안 막아놓는 듯...)
이 도메인 하위에 제가 접속할 수 있는 모든 폴더의 모든 파일들을 한 번에 다운받는 방법이 있을까요?
윈도우용 wget으로 시도해봤는데, 한글 파일명이 대부분이라 그런지 다운에 실패하더라구요.
FTP처럼 클라이언트 SW 설치해서 목록을 자유롭게 볼 수 있는 게 있으면 좋을텐데,
아파치 기반의 웹페이지에서는 제가 찾아본 바로는 그런 게 없는 것 같더라구요
정리하자면, apache 기반의 웹페이지에서 수십개 폴더의 하위 디렉토리의 모든 파일(파일명 한글,영문,특문 제각각)을 한 번에 다운받는 방법이 있을까요?
~_~
Web Crawling À¸·Î °Ë»öÇؼ ã¾Æº¸¼¼¿ä.
¹Þ´Â°Ô ½ÈÀ¸¸é ¸·À¸¸é µÇ´Âµ¥, Àú·¸°Ô µÐ°Ç ÀÚ¾÷ÀÚµæÀ̶õ ´À³¦µµ µì´Ï´Ù
À¥¼¹ö¿¡¼ robots.txt ¼³Á¤À» Çصֵµ ¿ìȸÇؼ ±Ü¾î°¡´Â Àâ³ðµéÀÌ Â¥ÁõÀÌ ¸¹ÀÌ ³ª´õ±º¿ä.
¼¹ö ÀÏÆ®·¡ÇÈ ¿ä±ÝÀ¸·Î µ¹¸®´Â °Çµ¥ º¿µéÀÌ ´Ù ¼Ò¸ðÇعö¸®±âµµ ÇÏ°í.
https://superuser.com/questions/200426/curl-to-download-a-directory
HTTP ÀÚü°¡ ±¸Á¶ÈµÈ °æ·Î¸¦ ¾Ë·ÁÁÖ´Â ³à¼®ÀÌ ¾Æ´Ï´Ù º¸´Ï Á¤»óÀûÀ¸·Î µÇÁö ¾ÊÀ»¼öµµ ÀÖ½À´Ï´Ù.
°ú°Å¿¡´Â flashget °°Àº°É ½è´Âµ¥ ¿äÁò¿¡´Â ÀÌ·±½ÄÀ¸·Î ¹ÞÁú ¾Ê¾ÆºÁ¼ Àß ¸ð¸£°Ú½À´Ï´Ù.
Åø Çϳª ¾²½Ã¸é µÉµíÇÕ´Ï´Ù. ¹üÀ§´Â ÇØ´ç »çÀÌÆ®·Î °íÁ¤ÇϽñ¸¿ä.
Áö±ÝÀº Àú À¥»çÀÌÆ®°¡ ´ÝÇû³×¿ä;;