¿ÀÇÁ¶óÀΠȯ°æ¿¡¼­ »ç¿ëÇÒ ¼ö ÀÖ´Â OCR ÇÁ·Î±×·¥ Ãßõ ºÎŹµå¸³´Ï´Ù.

   Á¶È¸ 217   Ãßõ 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 

워드 프로그램으로 작성한 문서를 출력한 후, 서명을 하거나 한 것을 다시 스캔을 한 PDF파일이 있습니다.

현재는 알PDF를 이용하여 OCR을 입히고 있는데, 20메가까지라 120메가가 되어버리네요....

ABBYY는 성능이 좋다고 하는데, 자주 사용하는게 아니다보니 가격이 좀 비싸서 망설여지내요..

혹시 다른 추천 프로그램이 있을까요?

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
ubuntu ¿¡¼­ Å×½ºÆ® Çغ¼¶§ ¿µ¾î´Â ²Ï Àß ÀνÄÇß´ø °Í °°½À´Ï´Ù.
´Ù¸¸ pdf´Â ¾Æ´Ï°í À̹ÌÁö¿´´Âµ¥ pdf¸¦ À̹ÌÁö·Î ¹Ù²Ù°í ÇÏ¸é ¾î¶»°Ô µÇµÉ °Í °°±ä ÇÕ´Ï´Ù.
https://github.com/tesseract-ocr/tesseract
chis 03-20
Àúµµ pythonÀÌ¿ëÇؼ­ (Å×¼­·ºÆ®¸¦ ¾¹´Ï´Ù) »ç¹«½Ç¿¡¼­ ¼­·ù PDF·Î ½ºÄµÇسõÀº°Å ÀüºÎ OCRÇؼ­
DB¿¡ ³Ö´Â°Å Çغþú´Âµ¥¿ä. À̹ÌÁö Àüó¸®(?)¸¦ Àß ÇؾßÇÒ°Å°°´õ¶ó°í¿ä.
»ý°¢º¸´Ù´Â Ç°ÁúÀÌ ÁÁÁö´Â ¾Ê¾Ò½À´Ï´Ù.


QnA
Á¦¸ñPage 222/5718
2014-05   5207483   Á¤ÀºÁØ1
2015-12   1739229   ¹é¸Þ°¡
2023-11   1923   Àü¼³¼ÓÀǹ̡¦
2023-11   2729   ¸¶¹ý»ç¿ÀÁî
2023-11   1350   ¹ä¾Ë1±èÇü±Ù1
2023-11   3460   ³ª½ºÁÁ±º
2023-11   1875   Caig
2023-11   2306   ġŲÁÁ¾Æ¿ä
2023-11   2504   ¿µ»êȸ»ó
2023-11   1565   »þ¸Û
2023-11   1359   ¹Ì´ã
2023-11   3415   ´À¸°´ß
2023-11   1844   ÃÖâÇö
2023-11   1943   ¸·³»ÀÇÇÏ·ç
2023-11   1418   ±¸Â÷´Ï
2023-11   1917   Á¨¼­¹ö
2023-11   1770   Á¨¼­¹ö
2023-11   2740   Çϵ¦
2023-11   2509   ¹«¾Æ
2023-11   1589   ¹«½î»Ôó·³
2023-11   2097   ġŲÁÁ¾Æ¿ä
2023-11   2100   Á߸³±â¾î¿ÀÅä