¿ÀÇÁ¶óÀΠȯ°æ¿¡¼­ »ç¿ëÇÒ ¼ö ÀÖ´Â OCR ÇÁ·Î±×·¥ Ãßõ ºÎŹµå¸³´Ï´Ù.

   Á¶È¸ 154   Ãßõ 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 

워드 프로그램으로 작성한 문서를 출력한 후, 서명을 하거나 한 것을 다시 스캔을 한 PDF파일이 있습니다.

현재는 알PDF를 이용하여 OCR을 입히고 있는데, 20메가까지라 120메가가 되어버리네요....

ABBYY는 성능이 좋다고 하는데, 자주 사용하는게 아니다보니 가격이 좀 비싸서 망설여지내요..

혹시 다른 추천 프로그램이 있을까요?

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
ubuntu ¿¡¼­ Å×½ºÆ® Çغ¼¶§ ¿µ¾î´Â ²Ï Àß ÀνÄÇß´ø °Í °°½À´Ï´Ù.
´Ù¸¸ pdf´Â ¾Æ´Ï°í À̹ÌÁö¿´´Âµ¥ pdf¸¦ À̹ÌÁö·Î ¹Ù²Ù°í ÇÏ¸é ¾î¶»°Ô µÇµÉ °Í °°±ä ÇÕ´Ï´Ù.
https://github.com/tesseract-ocr/tesseract
chis 03-20
Àúµµ pythonÀÌ¿ëÇؼ­ (Å×¼­·ºÆ®¸¦ ¾¹´Ï´Ù) »ç¹«½Ç¿¡¼­ ¼­·ù PDF·Î ½ºÄµÇسõÀº°Å ÀüºÎ OCRÇؼ­
DB¿¡ ³Ö´Â°Å Çغþú´Âµ¥¿ä. À̹ÌÁö Àüó¸®(?)¸¦ Àß ÇؾßÇÒ°Å°°´õ¶ó°í¿ä.
»ý°¢º¸´Ù´Â Ç°ÁúÀÌ ÁÁÁö´Â ¾Ê¾Ò½À´Ï´Ù.


QnA
Á¦¸ñPage 1/5717
2014-05   5205639   Á¤ÀºÁØ1
2015-12   1737739   ¹é¸Þ°¡
2003-06   0   ¹Ú¹Î¼ø
2006-04   1   ÀÌ¿µÀÍ
2015-11   3   AKAÁö´Ï
2022-04   13   ¹Öµ¹ÀÌ
2023-06   14   ¼­ÅÂÇÏ
2016-01   17   ¸¶´­
2024-02   19   ½Å´Ù¿µ
2024-01   19   ÀÌÇѼÖa
2023-03   27   marcchoi1969
2021-01   42   ¹Ì¹Ì¸¶¿ì½º
2021-07   44   ³ª¿ä
2019-06   55   FreeBSD
2018-05   78   ±è°Ç¿ì
2023-02   81   epowergate
2020-09   86   ºñ¹Ù¶÷°úÇÔ²²
2021-11   90   NaHS
03-20   94   ´ëÀü±èÇü¿î
2016-03   99   ±áÀç
03-14   104   ÅäÅ丮
2020-12   108   Alissica