Project Description

NHocr is a command line OCR (Optical Character Recognition) program for Japanese language, etc. It has been designed to recognize machine-printed Japanese characters and some ASCII characters/symbols in an image. NHocr is probably the first Open Source Japanese OCR software (offline, machine-printed), except some experimental, partial codes open to academic communities.

The main repository, originally at Google Code, has been migrated to here. Older versions can be found at Google Code.

You can test-drive NHocr using the following:
* Japanese character recognition WeOCR service
* Capture2Text

Review
Your rating
Review this project

Statistics

2015-01-02 00:32
Review by どんぐり

Rating:
(11 of 17 people found this review helpful)
Windows 上でビルドしました。 ・MinGW 上です。 ・freetype 2.5.4 は何故かgzipあたりでリンクエラーになるのでソースをコメントしました。(たぶん使ってないところだろうと思いました?) ・NHOCR 0.22 はシンボリックリンク関係を手動でコピー(ヘッダとLIB)しました。  以上でWindows上でも動作することを確認しました。 ・辞書のディレクトリを環境変数だけでなく、引数指定もあればうれしいかと・・  (いやはい、自分でやります) ・makechar 等のusage関係は読みましたが、今一つ辞書の取扱いがわからないです。  文献を探したのですが見当たらず・・  これもソースみるかと思いましたが、そのまえにレビューに書いとくと何かアップされるかな?^^;; と思ったり。(えぇまぁソース見ます) 15倍も早くしなくていいのですが、今後もよろしくお願いします。

2014-12-13 09:51
Review by y_araki

Rating:
(10 of 15 people found this review helpful)
本のスキャン画像のページ番号(主に縦書き漢数字)を認識する、という限られた用途で試してみました。 ・Linux(CentOS6)上で、すんなりビルドできて動きました。 ・画像ファイルはPPMに変換しました(ImageMagickを使用)。 ・標準出力に出力する機能が意外と便利です。 ・縦書き漢数字の認識は、うまく行ったり行かなかったりでした。"一二三"等の縦書きは人の目で見ても識別しづらいので、仕方ないところでしょう。

2013-08-29 00:11
Review by Anonymous

Rating:
(9 of 14 people found this review helpful)
windows版を使用いたしました、resultのウインドウが出ないと、もっと連続処理が行いやすくなるのですが
Review List

Recent Activities

2019-11-06
10:36
NHocr: OCR engine for Japanese language
[Ticket] Add Comment on ticket #39727
入力画像を見てみないと原因が判りませんが、罫線やルビなどの装飾、周囲にノイズとなる枠などが含まれ...
2014-08-30
21:06
NHocr: OCR engine for Japanese language
20:19
NHocr: OCR engine for Japanese language
20:19
NHocr: OCR engine for Japanese language
Show history