OCR기술이 어려운 기술인가요?

   조회 8512   추천 0    

 현재 무작위 알파벳과 숫자를 인식해줘야 할 필요성이 생긴 상황입니다.


지금은 경우의 수가 그다지 많지 않아서 그럭저럭 이미지를 일일이 따서 그 이미지가 의미하는 바를 수동으로 입력해놓고


이미지가 인식되면 저장된 값을 출력하는 단순한 방법을 쓰고 있습니다만 여기까지가 저의 한계입니다.


앞으로 문자가 뒤틀리거나, 반투명해질 가능성도 있습니다. 이럴 때 프로그래머분께 문자 인식 숫자 인식을 부탁드린다면


1. 해결이 되긴 될까요?

2. 비용은 얼마나 들까요?

3. 믿을 수 있는 프로그래머를 구할 수 있는 방법에 대한 조언도 부탁드립니다


이게 아주 어려운 기술이고, 현재의 기술로는 뒤틀림은 해결이 안된다는 얘기가 있는데 사실입니까?

짧은글 일수록 신중하게.
츄네다 2018-11
     
대충 C언어나 C++로 해야 한다는 내용 같네요

그렇다면 저 혼자는 안되겠지만.. 밑에 다른 분들이 조언해주신 바를 시도해보고

안되면 이 방법도 시도해볼 여지가 있겠네요 ㄱㅎㅎ 감사합니다
이선호 2018-11
A to Z까지 개발한다면 비싸겠지요. 요즘은 API, 오픈소스 들이 잘 나와있어서 OCR 자체에 대한 개발비용이 생각만큼 비싸지는 않습니다.
정확한 용도, 요구사항을 정리하시어 개발가능한 업체들을 찾아보시는걸 추천합니다.
초기 개발비는 수백 이내에서 가능할겁니다.
     
감사합니다 ~
     
감사합니다 ㅎㅎ
안형곤 2018-11
비전관련 SW에 그런기능이 있지 않나요?

전에 카메라로 차량번호 인식하는 그 엔진... 경북대학교에서 만들었던걸로 기억되구요..

그걸로 주차차단속을 했죠...

외국산 SW는 한글 무시하고..... 영어와 숫자만 가지고 인식했었고,

경북대학교에서 개발한 엔진은 차량번호에 들어가는 한글까지 인식이 된다고 하데요....

그걸로 차량번호판 인식형 주차단속의 시초가 되었고, 그놈으로 LPR 주차관제시스템과 차량 단속시스템이 탄생했다고 하더라구요...

알파벳과 숫자쪽은 외산 SW도 가능한걸로 압니다.

한글이 인식 되어야 한다면 경북대학교 산학협력쪽으로 문의해보셔야 할겁니다.

근데 대부분 반도체 검사쪽 장비에 SW를 쓰더라구요...

최종 아웃풋은 대부분 텍스트 파일로 나오구요.. 그걸 DB와 매칭후 rs232C로 후처리를 하더라구요.....
     
감사합니다 아직까지는 영어와 숫자만 나오고 있는데

문자 뒤틀림등이 추가 되면 한글도 나올 수도 있겠네요

그런데.. 그 자동차 표지판이나, 공장에서 일련 번호 같은거를 인식하기 위해 만들어졌다면

뒤틀림이나 반투명에는 좀 취약할 수도 있는건가요?
          
안형곤 2018-11
어느정도의 뒤틀림은.... 잡아줬던걸로 기억이 되구요.. 보통은 제품 컨베이어 벨트쪽에 지나가면서 인식시키면 거의 정 위치 나오지 않나요?

자동차 차번호 인식은 바닥에서의 높이와 루프를 이용하여 일정한 포멧을 잡아줬었습니다.
ZSNET5 2018-11
머신비전쪽을 하는 업체를 알아보시면 됩니다.
1. 해결이 되기는 됩니다. 인식률의 문제이고, 패턴이 유사하다면 어떻게든 할 수 있습니다.
  어느선까지 가능한지가 문제가 아니라 어느선에서 포기할지가 더 문제입니다.
2. 천차만별입니다만 예전처럼 터무니없는 가격은 아닙니다.
3. 개인적으로 프로그래머를 구해서 할 생각은 하지 마세요. 관리가 절대 불가능합니다.

사족을 좀 붙이자면...
안형곤님이 말씀하시는 경북대학교 엔진은 들어보지 못했습니다. 제가 주차단속/LPR 회사에 근무한지 10년이 넘었는데 처음 듣습니다.
OCR관련 프로젝트는 경북대학교 뿐만 아니라 수십군데에서 유행처럼 진행이 되었던 것들이고 그 중 하나에 경북대가 있었을지는 모르겠습니다만, 그걸로 주차단속을 하는 실제 솔루션이 개발되지는 않은 것으로 알고 있습니다. 단지, 현재 경북대학교 안에 사무실을 가지고 있는 그 계통 업체는 있습니다.

프로그램의 개발은 개발 경험이 많은 업체에 맡기시되 결과물+소스코드를 제출하는 형식으로 하셔야 합니다.
어느 업체든 간에 100% 만족할 결과물을 절대 주지 않으며, 세부적인 수정사항이 있을 때 마다 "부탁"하는 형식이 되어서는 100% 만족할 결과물을 얻을 수 없습니다.
하지만, 절대로 OCR 엔진은 주지 않을 것이므로...그 부분은 바이너리(보통 DLL)로 받으실 수 밖에 없을 것입니다.

현재 문자인식기술은 영숫자의 경우에는 인쇄된 활자의 경우에는 99.99% 읽어내는 수준이며, 한글은 그보다 인식률이 떨어집니다.
의외로 어려운 것이 바로 일본어인데.... 이놈의 일본어는 히라가나+카타카나+한자+숫자+영어 까지 짬뽕이 되어 있기 때문에 머리에 김이 솔솔 나는 수준이라 합니다.(저는 개발자가 아니라서... 들은 대로만.... 오히려 아랍어가 더 쉽다고....하더라구요.)
저희 회사에서는 이런류의 개발의뢰를 받지 않기 때문에 도와드리기는 어려우나, 개발회사를 찾을 방법을 알려드리자면
1. 네이버에서 "머신비전"이라는 키워드로 검색한다.
2. 한국머신비전협회에 문의한다.
3. 머신비전용 카메라 공급사에 문의한다.(의외로 머신비전용 카메라 공급사가 많지 않습니다.)
등으로 해 보세요...
     
아이고 ㅎㅎ 관련 업계에 종사하시는 분께서 조언해주시니 뭔가 더 자세한 내용이군요 ㅎㅎ

사실 지금은 영어+숫자이고 앞으로 추가되면 한글이 추가될 수도 있는데 일본어쪽은 걱정 안해도 될 상황입니다만..

이게 꼭 카메라로 현실의 글자를 인식해야 하는건 아니고요 컴퓨터 내의 그림을 기준으로 텍스트를 출력해주면 되는건데

이러면 좀 더 싸게 주문할 수도 있을까요?
          
ZSNET5 2018-11
어.... 그러면 말이 좀 다르네요...
일단 카메라에서 그래빙 하는 쪽 로직이 싹 빠져 버리니까 가격이 확 떨어집니다.
그러니까, 특정한 그림 파일(예를 들어 JPG)를 불러다가 그걸  읽어내면 되는 거라는 말씀인데..
영숫자에 대한 거라면 오픈소스로 꽤 많이 나와 있습니다.
그냥 구글에서 "ocr opensource" 또는 "OCR 오픈소스"로 검색만 해 보셔도, 파일읽어서 TXT로 돌려주는 오픈소스들이 널려 있습니다.
영숫자 인식, 특히 말씀하시는 거라면 그것만 해도 충분할껍니다.
tesseract 같은거 쓰시면 될꺼예요.
               
감사합니다 ㅎㅎ 그 tesseract가 뒤틀림, 반투명에도 어느정도는 작동해줍니까?

사실 정자체인 지금은 저 혼자서도 해결이 됬는데요, 앞으로 뒤틀림, 반투명으로 패치될 경우를

미리 대비해두고자 질문한 것이거든요
                    
ZSNET5 2018-11
정도의 문제라니까요...
http://egloos.zum.com/mcchae/v/11286830
이런거 참조해서 한번 테스트 해 보세요. 된다 안된다를 제가 말씀드리기는 어렵네요..
                    
김우진 2018-11
문자 인식은 형상 자체가 아니라 패턴 분석을 위한 hidden Markov 모델에 기초를 두기 때문에, 뒤틀림이 있거나 꺼꾸로 놔도 인식할 수 있는 걸로 알고 있습니다만... 사람이 봐도 애매한 경우라면 컴퓨터도 인식 못할것 같아요.
     
안형곤 2018-11
제가 대구쪽에 있어서 가까운쪽 이야기를 먼저 듣게 된거 같습니다.

전국 최초로 차량번호 인식 단속 시스템을 도입한곳이 대구광역시 서구청이고, 그걸 이룰수 있었던게 경북대학교 산학협력센터에서 개발한 엔진입니다.

한글처리가 가능해서 성공한 케이스이지요...

그 엔진을 이용 차량번호 인식형 주차관제시스템을 도입한 회사가 한맥IPS(대구 업체)입니다.

제가 이 걸 어떻게 알았냐 하면...

앞전에 살던 아파트에 차량번호 인식형 주차차단기(9년전 당시 최첨단 시스템) 도입건 때문에 입주자대표회의에서 도입건을 검토했었습니다.

아참.. 참고로 울 회원님중에.. 해당 SW 다뤘던분이.. 채선일 님입니다. ^^

지금도 그쪽 관련된 업무를 보고 계셨던걸로 기억되네요.

절차가 카메라촬영--->흑백으로 반전 --->문자 인식--->텍스트 생성 이렇게 되더라구요...
          
ZSNET5 2018-11
네.. 한맥IPS야 저도 잘 아는 업체이고, 지금도 영업적으로 자주 부딛힙니다.
제품자체는 나쁘지 않아요... ^.^;; 물론 저희 회사 제품이 더 좋습니다.. 하하하..
....
자료 찾아보니까.. 대구 서구청에서 2006년도에 저희 회사 제품 고정형 1기, 차량탑재형 1기를 도입하신 이력이 보이네요... ^.^;;
어우... 진짜 오래된 고객인데요..
     
아니 비용보다도.. 제가 만족할 만한 결과를 얻기 위해서는

부탁하는 형식이어서는 안되고, 결과물+소스코드로 받아야 한단 말씀이시죠?

DLL로 받는게 어떤 의미가 있습니까?
          
ZSNET5 2018-11
일단은 저 위에 제가 새로 달아놓은 답을 보시고....
프로그램 조금만 짤 줄 아시면 그냥 tesseract 엔진 가져다가 쓰셔도 대충 될 껍니다.
그리고....
핵심 엔진은 DLL로(이건 회사 핵심사항이라서 누구도 소스코드 제공 안함), 그 외 부분은 소스코드를 받아라... 하는 말씀입니다.
사실, 소스코드 제공여부에 따라서도 금액의 차이가 꽤 큽니다만, UI에 대한 부분만이라도 소스코드가 있으면 자유도가 높아집니다..
이게 사실 개발이라는게 딱 어디까지가 완결이라고 정하기가 애매모호한거라, 개발자 입장에서 끌려다닌다고 생각될 수도 있고, 반대로 발주자 입장에서 끌려다닌다고 생각이 될 수도 있거든요.. 그래서 어지간한 결과물 나왔는데 시간이 지연되면, 그냥 소스코드 받아다가 직접 수정하는게 더 나은 선택일 수도 있기 때문에 드리는 말씀입니다.
          
정희섭 2018-11
회사의 핵심 기술 알고리즘이 들어간 소스코드는 당연히 오픈하지 않겠죠?
회사를 인수할 만큼의 돈을 준다면 모르겠지만요.
이런 부분은 라이브러리 바이너리(dll/so)로 컴파일해서 줍니다
그 라이브러리를 불러와서 응용하는 부분에 대해서는 소스코드 받으시라는 말씀입니다
무아 2018-11
만약 직접 라이브러리를 구매해서 개발하신다면
상용 OCR 라이브러리 같은 경우 웹사이트에서 검증해 볼 수 있는 웹 데모 또는 PC에 설치하여 구동시킬 수 있는 데모, 짧은정 기간 동안 개발할 수 있는 API 제공 등 을 하는 곳이 많으니까 이런 곳을 이용해보는 것도 괜찮을 겁니다.
이것 저것 써보고 입맛에 골라 쓰면 적당하지 않을까 싶습니다... (실제 OCR 자체를 스스로 개발하기에는 경험과 실력이 비교도 안되게 모자랄 수 있습니다)
보통 테스트할 샘플 이미지 몇개 정해두고  이런 상용 라이브러리 몇개에 적용해보고
상용라이브러리에 샘플 이미지를 바로 넣어도 잘 되는가? 특정 전처리 과정을 한번 해주는 것이 좋은가. 속도는 빠른가, 놓치는 것이 있는가? 이정도 분석해서
적당한 것을 골라 쓰는게 좋을 겁니다.

요즘은 AI 를 통한 성능이 진화하는 OCR도 나오죠. 국내 업체들도 있구요. 이런데에 샘플 이미지 보내주고 결과를 리포트 받을 수 도 있습니다.
자게에 보니까 USB로 돌리는 인텔의 컴퓨트스틱2 라는 것이 활성화 되면 라즈베리파이 + 스틱으로 해결되는 솔루션도 조만간 나오지 않을까 싶습니다.
epowergate 2018-11
일반적인 OCR은 정말 어렵습니다.
필요하신 정확한 사용용도를 알아야 합니다.
폰트종류, 문자크기, 문장(이미지)에서 폰트종류와  문자크기가 섞여있는지, 반투명 배경에 뭐가 있는지 등에 따라서 인식율이 천차 만별입니다.
문자길이가 10다 일수도 있고 1000자 일수도 있는지 등등 차이 많습니다.


QnA
제목Page 1508/5730
2014-05   5266962   정은준1
2015-12   1791886   백메가
2010-04   8672   김영호(진주)
2010-04   8660   박남규
2016-02   4353   NiteFlite9
2013-05   11516   박문형
2017-01   6064   전설속의미…
2020-07   6280   광주동키호테
2010-05   8191   나너우리
2014-11   3535   방o효o문
2023-08   2721   궁그메
2018-03   4777   페르세우스
2019-05   3320   통신보안
2023-08   1873   aira
2018-04   4424   드루와드루와
2022-01   2437   전직P연구원
2013-06   6724   장동건2014
2016-02   7359   inquisitive
2018-04   4487   김건우
2019-05   3808   여주농민76
2013-06   6906   김건우
2018-04   4396   석호