특정파일의 내부를 찾는(PDF) 검색엔진을 구현하고 싶은데, 프로그래밍 실력이 약해 참조 해볼수 있는 서적이나 인터넷 사이트를 알고 싶습니다.
다른 솔루션으로 대체하고 있는 상황이지만,
db와의 연계를 통한 full text 검색 엔진을 목표로 삼고 있습니다 ^^
특정파일의 내부를 찾는(PDF) 검색엔진을 구현하고 싶은데, 프로그래밍 실력이 약해 참조 해볼수 있는 서적이나 인터넷 사이트를 알고 싶습니다.
다른 솔루션으로 대체하고 있는 상황이지만,
db와의 연계를 통한 full text 검색 엔진을 목표로 삼고 있습니다 ^^
PDF°¡ À̹ÌÁöÆÄÀÏ·Î ¸¸µé¾îÁø°Å¶ó¸é OCRÀ» °ÅÄ¡Áö ¾ÊÀ¸¸é ¾ÈµÉ°ÍÀÌ°í.... PDF¾È¿¡ TEXT°¡ ÀÖ´Ù¸é TEXT¸¦ ãÀ¸¸é µÇ±¸¿ä... Çǵð¿¡ÇÁÆÄÀÏÀÌ ÀÖ´Â Æú´õ¿¡¼ ÆÄÀϳ» ÅؽºÆ®½áÄ¡¸¦ º¸Åë À©µµ¿ì³ª Ä¿¸Çµå Åø·Î ÇßÀ»¶§ µÈ´Ù¸é ±×´ÙÁö ¾î·ÆÁö¾ÊÀ»ÅÙµ¥¿ä...
¹«½¼ ½ºÆä¼È Æ÷¸äÀ» °ÅÃÄ¾ß ÇÑ´Ù¸é Á¶±Ý ´õ º¹ÀâÇÏ°ÚÁö¸¸ ÀÌÁ¦ PDF¿¡ °ü·ÃµÈ OPEN¶óÀ̺귯¸®°¡ Á¸ÀçÇÑ´Ù°í ¹Ï½À´Ï´Ù~
±×¸®°í Elasticsearch ÀÇ °æ¿ì ÅؽºÆ®¸¦ »öÀÎ ÈÄ¿¡ »ç¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù. ÇѱÛÀÇ °æ¿ì MeCab-ko ¸¦ ÀÌ¿ëÇؼ ÇüÅÂ¼Ò ºÐ¼®À» ÀÌ¿ëÇØ °Ë»ö°ú »öÀÎÀ» ÇÒ ¼ö ÀÖ½À´Ï´Ù.
°Ë»ö¾î "Elasticsearch ÇÑ±Û ÇüżÒ" ¸¦ °Ë»ö Çغ¸½Ã¸é ¸¹Àº ¿¹Á¦°¡ ³ª¿É´Ï´Ù.