Author: 별님
Forum: 자유 게시판
Date: 2013-12-09
충분히 있을 것 같다는 정도의 (영양가 없고 도움도 안되는 orz) 추측 밖에는 못하겠어요..
그래서 찾아봤습니다.
https://code.google.com/p/linux-intelli ... -solution/
https://help.ubuntu.com/community/OCR
..정도에서 테스트해보고 가장 나은 걸 쓰면 될 것 같군요.
tesseract가 한국어 인식에 가장 좋다고 합니다. http://t.lab.naver.com/ocr/에서 테서렉트를 체험해볼수 있습니다. 화질이 좋아야 정상적으로 인식되는 것 같습니다. 한글을 인식은 하나 인식률이 매우 떨어지므로 그냥 사용하기엔 무리가 있어 보입니다.
테서렉트에 한글을 적용하려면, svn checkout -r 309 http://tesseract-ocr.googlecode.com/svn/trunk/ tesstemp; sudo cp testmap/testmap/kor.traineddata /usr/share/tesseract-ocr/tessdata; chmod 755 /usr/share/tesseract-ocr/tessdata/kor.traineddata; chown root:root /usr/share/tesseract-ocr/tessdata/kor.traineddata; rm -r testmap을 하신뒤 tesseract 이미지파일명 저장파일의확장자를제외한이름 -l kor의 형식으로 문자해독을 하시면 됩니다.
Forum: 자유 게시판
Date: 2013-12-09
충분히 있을 것 같다는 정도의 (영양가 없고 도움도 안되는 orz) 추측 밖에는 못하겠어요..
그래서 찾아봤습니다.
https://code.google.com/p/linux-intelli ... -solution/
https://help.ubuntu.com/community/OCR
..정도에서 테스트해보고 가장 나은 걸 쓰면 될 것 같군요.
tesseract가 한국어 인식에 가장 좋다고 합니다. http://t.lab.naver.com/ocr/에서 테서렉트를 체험해볼수 있습니다. 화질이 좋아야 정상적으로 인식되는 것 같습니다. 한글을 인식은 하나 인식률이 매우 떨어지므로 그냥 사용하기엔 무리가 있어 보입니다.
테서렉트에 한글을 적용하려면, svn checkout -r 309 http://tesseract-ocr.googlecode.com/svn/trunk/ tesstemp; sudo cp testmap/testmap/kor.traineddata /usr/share/tesseract-ocr/tessdata; chmod 755 /usr/share/tesseract-ocr/tessdata/kor.traineddata; chown root:root /usr/share/tesseract-ocr/tessdata/kor.traineddata; rm -r testmap을 하신뒤 tesseract 이미지파일명 저장파일의확장자를제외한이름 -l kor의 형식으로 문자해독을 하시면 됩니다.