Simple OCR 1.0 - 문자인식/번역 프로그램

728x90

안녕하세요...

 

타오바오 중국 온라인 쇼핑몰 기웃 기웃하다가.. 중국어야 복사 붙여넣기 하면 되는데..

이미지에 있는 한자는 당최 무슨뜻인지도 모르겠고.. 쓸수도 없고

 

그래서 OCR 프로그램을 사용 해봤습니다. 그리고.. 이것 저것 알아보다가..

Tesseract 3.5 버젼을 접하게 되었고..  OCR (optical character reader)  인식을 을 좀더 쉽게

기능을 좀더 쉽게 사용할 수 있는 Simple OCR 만들어 보았습니다.

 

Simple OCR 프로그램은 직접 문자 인식을 하지 않습니다..

Simple OCR 에서 캡쳐된 이미지를 Tesseract 프로그램으로 분석하여 텍스트로 파일로 저장됩니다.

아래와 같이 실행, 처리 된다고 보시면 됩니다.

 

     Simple OCR -> 이미지 캡쳐 -> Tesseract -> 문자인식 -> 텍스트파일 ->  Simple OCR 파일 읽어옴.

 

 

이미지 크기 및 문자 크기가 중요 합니다. 화려한 배경위에 있는 문자는 인식 못할 확률이 매우 높습니다.

대각선으로 써있는 문자도 인식이 안돼요!!! ㅠ,.ㅠ

 

단색 바탕에 단색 문자 인식 잘 됩니다 ;;

 

 

 

 

 

 

처음 실행 화면입니다.

 

 

 

 

배포 파일에는 영어,중국어, 일본어 3개 최근  트레이닝된 파일이 들어가 있습니다!!

"Capture" 전에 원하는 언어를 선택 하셔야 합니다.

 

 

 

 

이렇게 "Capture" 버튼을 클릭 하거나 "Ctrl + ~" 키를 눌러 캡쳐 할 수 있습니다.

 

 

 

 

 

 

버튼 클릭 하면 마우스 밑에 빨간 점이 보입니다.

 

 

 

 

 

원하는 문자위에 박스를 그려서 캡쳐를 진행 합니다.

문자크기가 커야 인식률이 좋아 집니다.

 

 

 

 

 

캡쳐후 텍스트 박스에 해당 단어가 입력되어 있습니다.

 

 

 

 

 

 

네이버 미니 웹사전 "열기" 클릭 하면 해당 단어를 네이버 사전에서 번역해줍니다.

 

 

 

 

클립보드 자동 저장 기능은 문자 인식 후 텍스트 파일을 클립보드에 자동으로 저장됩니다.

 

 

 

 

 

프로그램 사용 하시다가 도움이 되었다면 기부를 받고 있습니다!!!

 

 

 

 

 

캡쳐 후 에러시

Tesseract 포터블 버젼을 받아서 배포 하고 있습니다.

Visual Studio 2015용 Visual C++ 재배포 가능 패키지 설치 안된 곳에서는

 

아래와 같은 메세지가 나올 수 있습니다. ( Tesseract 3.5 실행시 발생됨)

      

 

이런경우에는 Microsoft 다운로드 사이트에 방문 하여 해당 패키지를 설치 해야 합니다.

 - https://www.microsoft.com/ko-KR/download/details.aspx?id=48145

 - vc_redist.x64.exe , vc_redist.x86.exe 두개 모두 설치 해야 합니다!

 

 

 

 

 

 

 

 

 

바이러스토탈 바이러스 검사 했습니다.  (탐지비율 2/56)  검사날자 : 2016년 10월 6일

https://virustotal.com/ko/file/8d56374b5c568e5985cdc74e496507835234fe7766205c5e3bd34b93938a25ad/analysis/1475714460/

 

 

 

다운로드 (10Mb 분할 압축)

 

Simple_OCR.zip

 

Simple_OCR.z01

 

Simple_OCR.z02

 

Simple_OCR.z03

 

Simple_OCR.z04

 

 

 

 

 

반응형

댓글()