solr(lucene)이나 elasticsearch의 예제들이 없을까요?

   조회 5161   추천 0    

특정파일의 내부를 찾는(PDF) 검색엔진을 구현하고 싶은데, 프로그래밍 실력이 약해 참조 해볼수 있는 서적이나 인터넷 사이트를 알고 싶습니다. 

다른 솔루션으로 대체하고 있는 상황이지만, 

db와의 연계를 통한 full text 검색 엔진을 목표로 삼고 있습니다 ^^

짧은글 일수록 신중하게.
박명근TN 2016-03
일단 json을 검색해보시는 것이 좋을 것 같습니다.
우선 PDF가 어떻게 형성된것인지에 따라서 많이 다르지 않을까요?
PDF가 이미지파일로 만들어진거라면  OCR을 거치지 않으면 안될것이고....  PDF안에 TEXT가 있다면 TEXT를 찾으면 되구요...  피디에프파일이 있는 폴더에서 파일내 텍스트써치를 보통 윈도우나 커맨드 툴로 했을때 된다면 그다지 어렵지않을텐데요...
무슨 스페셜 포멧을 거쳐야 한다면 조금 더 복잡하겠지만 이제 PDF에 관련된 OPEN라이브러리가 존재한다고 믿습니다~
근원e 2016-03
일단 일반적인 PDF(이미지로 이루어지지 않은)은 여러 PDF라이브러리 등으로 텍스트를 추출 할 수 있습니다.

그리고 Elasticsearch 의 경우 텍스트를 색인 후에 사용할 수 있습니다. 한글의 경우 MeCab-ko 를 이용해서 형태소 분석을 이용해 검색과 색인을 할 수 있습니다.

검색어 "Elasticsearch 한글 형태소" 를 검색 해보시면 많은 예제가 나옵니다.
     
감사합니다


QnA
제목Page 2664/5710
2014-05   5159038   정은준1
2015-12   1693285   백메가
2017-02   5194   zaro
2007-04   5194   윤치열
2012-02   5194   FreeBSD
2006-10   5194   박진수
2014-11   5194   미놀사랑
2006-03   5194   김덕기
2016-04   5194   에이씨피유
2016-09   5194   빨간망또
2021-05   5194   SSen
2006-09   5194   김은섭
2022-04   5194   나로와
2018-07   5194   가을바람
2016-06   5194   송석후
2018-06   5194   Sakura24
2016-07   5195   블루영상
2014-12   5195   song05
2016-03   5195   황진우
2011-11   5195   차평석
2015-06   5195   겨울나무
2019-12   5195   구십평