Tesseract나 EasyOCR의 성능을 높이려면 어떻게 해야하나요?

쓰기

Tesseract나 EasyOCR의 성능을 높이려면 어떻게 해야하나요?

정의석

03-28

2025-03-28 20:46:01

조회 251 추천 0

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다

얼마전 OCR관련해서 질문을 했더니, Tesseract를 추천해 주셔서 AI의 힘들 빌어서 간단하게 코드를 작성했습니다.

그런데, 제가 생각했던것 보다 성능이 훨씬 안좋았습니다.

사람이 쓴 글씨를 촬영하거나 스캔한 파일은 아니고, 주로 컴퓨터나 스마트폰 캡처사진의 한글/영문/숫자를 인식해야 하는 상황입니다.,

OCR 하기전에 Gray처리를 한다거나 하는 것들은 해 봤는데, 큰 의미는 없었습니다. 오히려 나빠지는 경우도 있었고요....

인터넷을 찾아보니 Tesseract에 추가로 학습을 시켜야 한다는 것 같은데, 학습을 시키기 위한 자료는 제가 직접 만들어야 하는지요? 아니면 이런 학습자료도 공개된 것이 있을까요?

아니면 추가 학습이 된 Tesseract 라이브러리가 있을까요?

추가로,,, Tesseract 라이브러리의 경로에 한글이 포함되어 있는 경우 잘 안되는것 같습니다. 아예 안되는 것도 아니고, 좀 이상합니다. 경로에 한글이 없는 디렉토리 위치(1번위치)에서 한번 실행해 주고 나면, 한글이 있는 디렉토리 위치(2번위치)로 옮겨도 잘 됩니다. 물론 1번위치의 라이브러리는 지우고 2번위치에만 라이브러리가 있는 상태입니다. AI에게 물어보니 가능하면 한글이 없는 위치에 두라고 하더라고요.. easyocr은 아무런 문제가 없습니다.

짧은글 일수록 신중하게.



검은콩 03-28 오픈 모델은 한국어 다 잼병입니다 하다못해 gemini flash 이미지 ocr 추천드립니다 오픈 모델은 한국어 다 잼병입니다 하다못해 gemini flash 이미지 ocr 추천드립니다



정의석 03-28 아.. 오프라인 환경에서 해야 해서요. ㅠㅠ 아.. 오프라인 환경에서 해야 해서요. ㅠㅠ



검은콩 03-28 차라리 gemma 27b 를 GPU 에 로드하시고 짧은 이미지로 인식하게 하는 게 적중률이 더 높습니다 .... 오픈소스 답 없습니다. 차라리 gemma 27b 를 GPU 에 로드하시고 짧은 이미지로 인식하게 하는 게 적중률이 더 높습니다 .... 오픈소스 답 없습니다.



프리파파 03-28 Paddleocr 추천 합니다 중국 바이두에서 제작한거라고 하고 경험상 한글 인식율이 꽤 좋았습니다 https://github.com/PaddlePaddle/PaddleOCR Paddleocr 추천 합니다 중국 바이두에서 제작한거라고 하고 경험상 한글 인식율이 꽤 좋았습니다 https://github.com/PaddlePaddle/PaddleOCR



정의석 03-29 테서랙트랑 이지오씨알만 알았는데, 패들오씨알도 있었군요. 한번 해 보겠습니다. 테서랙트랑 이지오씨알만 알았는데, 패들오씨알도 있었군요. 한번 해 보겠습니다.



씨디공장 03-29 테서렉트를 그대로 쓰기엔 인식률이 많이 떨어집니다. 학습 시킬려면 모든걸 직접 하셔야 합니다. 되도록 표준화된 이미지 (이진화 원근변환 필수) 학습 시키길 권장 드리며 해당 소스코드는 검색으로 쉽게 찾으실 수 있습니다. 그렇다고 다른 ocr 이 완벽하다는건 아닙니다. 많은 가공이 필요하며 (이진화 및 기준점 변경, 글자 필터, 학습, 이미지 크기 변경, 원근변환 등) 만능이 아니라는 점을 아셨으면 합니다. 어떤거든 원하시는 만큼 100프로에 가깝게는 제공을 못해줄겁니다. 테서렉트를 그대로 쓰기엔 인식률이 많이 떨어집니다. 학습 시킬려면 모든걸 직접 하셔야 합니다. 되도록 표준화된 이미지 (이진화 원근변환 필수) 학습 시키길 권장 드리며 해당 소스코드는 검색으로 쉽게 찾으실 수 있습니다. 그렇다고 다른 ocr 이 완벽하다는건 아닙니다. 많은 가공이 필요하며 (이진화 및 기준점 변경, 글자 필터, 학습, 이미지 크기 변경, 원근변환 등) 만능이 아니라는 점을 아셨으면 합니다. 어떤거든 원하시는 만큼 100프로에 가깝게는 제공을 못해줄겁니다.

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

3646/5723

번호	제목Page 3646/5723	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1759156	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1759156 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (737)	정은준1	2014-05	5232447	0
[필독] 처음 오시는 분을 위한 안내 (737) 2014-05 5232447 1 정은준1
41557	[질문]삼성 4GB 2RX4 PC2-4200F-444-10-d0 메모리는 어디에 사용하는 메모리인가요? (4)	둥이엄마	2011-05	6115	0
[질문]삼성 4GB 2RX4 PC2-4200F-444-10-d0… (4) 2011-05 6115 1 둥이엄마
41556	[질문] SUN RACK 900-38에 Dell R220 Rail 장착 문의 (1)	여리	2015-03	4772	0
[질문] SUN RACK 900-38에 Dell R220 Rail… (1) 2015-03 4772 1 여리
41555	Raid / 레이드구성 어떤게 낫을까요 ? (NAS Server) (10)	제온프로	2019-09	3651	0
Raid / 레이드구성 어떤게 낫을까요 ? (NA… (10) 2019-09 3651 1 제온프로
41554	조립 질문입니다 1주일째 보다가 너무 힘들어서 고백함니다 ㅜㅜ (21)	순사랑	2016-05	5710	0
조립 질문입니다 1주일째 보다가 너무 힘… (21) 2016-05 5710 1 순사랑
41553	EP45T-UD3R 바이오스 질문 드립니다^^ (1)	adam2430	2018-07	3688	0
EP45T-UD3R 바이오스 질문 드립니다^^ (1) 2018-07 3688 1 adam2430
41552	하드돌연사 문의드립니다 (4)	송현우	2013-11	5364	0
하드돌연사 문의드립니다 (4) 2013-11 5364 1 송현우
41551	혹시 이 쿨러 팬 커넥터 규격 아시는분 계실까요? (9)	빛나래	2024-02	1567	0
혹시 이 쿨러 팬 커넥터 규격 아시는분 계… (9) 2024-02 1567 1 빛나래
41550	ga-ep45-ud3r 개조바이오스 구할수 있나요??? (3)	홍두깨	2015-03	4788	0
ga-ep45-ud3r 개조바이오스 구할수 있나요… (3) 2015-03 4788 1 홍두깨
41549	근처 건물 1층에 불법 오락실 (11)	나우마크	2019-10	3932	0
근처 건물 1층에 불법 오락실 (11) 2019-10 3932 1 나우마크
41548	광장비.. 어렵네요..[모듈 세팅]	김장우	2011-05	8627	0
광장비.. 어렵네요..[모듈 세팅] 2011-05 8627 1 김장우
41547	hwmonitor 값이 이상한거 같아요. (2)	이원재K	2013-11	6844	0
hwmonitor 값이 이상한거 같아요. (2) 2013-11 6844 1 이원재K
41546	안드로이드 VM (1)	나파이강승훈	2017-05	3574	0
안드로이드 VM (1) 2017-05 3574 1 나파이강승훈
41545	Raid 시스템 이전에 관해 질문드립니다. (8)	악땅	2013-11	3706	0
Raid 시스템 이전에 관해 질문드립니다. (8) 2013-11 3706 1 악땅
41544	노트북 BIOS Password 해제 방법? (4)	몰렉	2015-04	12094	0
노트북 BIOS Password 해제 방법? (4) 2015-04 12094 1 몰렉
41543	USB 3.0 전면 포트와 메인보드 연결. (2)	메뚜기가면맨	2019-10	7767	0
USB 3.0 전면 포트와 메인보드 연결. (2) 2019-10 7767 1 메뚜기가면맨
41542	사내 컴퓨터 자원 수집 프로그램 (6)	drson	2021-01	6201	0
사내 컴퓨터 자원 수집 프로그램 (6) 2021-01 6201 1 drson
41541	D1581 보드 가장 기본형보드 바이오스 기본설정값 (6)	twotheall	2024-03	2706	0
D1581 보드 가장 기본형보드 바이오스 기… (6) 2024-03 2706 1 twotheall
41540	데비안12 CLI 로그인 화면 끄기? 절전? 방법 (5)	양시열	2024-03	1993	0
데비안12 CLI 로그인 화면 끄기? 절전? 방법 (5) 2024-03 1993 1 양시열
41539	범용성과 최적화의 상관관계 ?? (8)	김영기	2017-05	3861	0
범용성과 최적화의 상관관계 ?? (8) 2017-05 3861 1 김영기
41538	500기가 고장하드 질문입니다. (6)	AKMU	2018-08	4000	0
500기가 고장하드 질문입니다. (6) 2018-08 4000 1 AKMU