¿ÀÇÁ¶óÀΠȯ°æ¿¡¼­ »ç¿ëÇÒ ¼ö ÀÖ´Â OCR ÇÁ·Î±×·¥ Ãßõ ºÎŹµå¸³´Ï´Ù.

   Á¶È¸ 413   Ãßõ 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 

워드 프로그램으로 작성한 문서를 출력한 후, 서명을 하거나 한 것을 다시 스캔을 한 PDF파일이 있습니다.

현재는 알PDF를 이용하여 OCR을 입히고 있는데, 20메가까지라 120메가가 되어버리네요....

ABBYY는 성능이 좋다고 하는데, 자주 사용하는게 아니다보니 가격이 좀 비싸서 망설여지내요..

혹시 다른 추천 프로그램이 있을까요?

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
ubuntu ¿¡¼­ Å×½ºÆ® Çغ¼¶§ ¿µ¾î´Â ²Ï Àß ÀνÄÇß´ø °Í °°½À´Ï´Ù.
´Ù¸¸ pdf´Â ¾Æ´Ï°í À̹ÌÁö¿´´Âµ¥ pdf¸¦ À̹ÌÁö·Î ¹Ù²Ù°í ÇÏ¸é ¾î¶»°Ô µÇµÉ °Í °°±ä ÇÕ´Ï´Ù.
https://github.com/tesseract-ocr/tesseract
chis 03-20
Àúµµ pythonÀÌ¿ëÇؼ­ (Å×¼­·ºÆ®¸¦ ¾¹´Ï´Ù) »ç¹«½Ç¿¡¼­ ¼­·ù PDF·Î ½ºÄµÇسõÀº°Å ÀüºÎ OCRÇؼ­
DB¿¡ ³Ö´Â°Å Çغþú´Âµ¥¿ä. À̹ÌÁö Àüó¸®(?)¸¦ Àß ÇؾßÇÒ°Å°°´õ¶ó°í¿ä.
»ý°¢º¸´Ù´Â Ç°ÁúÀÌ ÁÁÁö´Â ¾Ê¾Ò½À´Ï´Ù.


QnA
Á¦¸ñPage 9/5723
2015-12   1757659   ¹é¸Þ°¡
2014-05   5230920   Á¤ÀºÁØ1
01-26   382   galaxyfamily
03-07   383   ¶ó¸é»ç¸®Ãß¡¦
02-17   383   ÀüÀÏÀå
00:23   383   ¾Æ¸¶µ¥¿ì¾²
03-15   384   ¹«Áö°³reinb¡¦
02-25   385   ±èÁØÀ¯
03-12   386   ¿À¼º±â
2020-02   387   TRUE
03-07   387   Psychophysi¡¦
2019-01   388   TRUE
03-29   389   ½Â¸®ÀÇ»÷µð¡¦
03-07   391   ÇöÁØÀÌ
02-08   391   alpha099
02-25   393   Naas
03-12   393   ¼­¹ö°°ÀºÀλý
03-20   394   ÄÝÅ©
02-26   395   lovemiai
02-17   395   À׿©
03-20   396   ¹ÚÀ§·Õ
03-18   396   ±èÇö¸°