Develop and Download Open Source Software

Show incremental difference of selected versions of NHocrについて.

category(Tag) tree

file info

category(Tag)
root
file name
about-140830
last update
2008-09-13 01:14
type
HTML
editor
H. Goto
description
NHocrの紹介
language
Japanese
translate
--- /tmp/DOCMAN2sxXr3D	2024-09-19 18:39:26.508393038 +0900
+++ /tmp/DOCMAN2aTCtqE	2024-09-19 18:39:26.508393038 +0900
@@ -1,113 +1,113 @@
-<html>
-<head>
-<meta http-equiv="Content-Type" content="text/html;charset=EUC-JP">
-<style type="text/css">
-  h1 {text-align: left}
-  h2 {text-align: left}
-  .stext {font-size: small;}
-</style>
-<title>NHocr - the Japanese OCR - Project Home</title>
-</head>
-<body bgcolor="#f4f4f4">
-<h1>NHocr - 日本語文字認識プログラム</h1>
-
-<p>Since Sep 8, 2008 / Last update: Sep 13, 2008</p>
-
-<hr width="100%"/>
-<p>
-この文書は<a href="http://code.google.com/p/nhocr/">
-nhocr: OCR engine for Japanese language</a> (Google Code)
-にある紹介文を日本語訳し、若干の変更を加えたものです。
-</p>
-
-
-<a name="introduction"/>
-<h2>NHocrについて</h2>
-
-<p>
-NHocr は日本語に対応したコマンドライン形式の
-文字認識(OCR)プログラムです。
-NHocr は画像中の日本語文字やASCII文字/シンボルを認識します。
-NHocr はフリーのオープンソースな
-OCRソフトウェアとしてリリースされる予定です。
-</p>
-<p>
-NHocr はウェブサービス
- <a href="http://weocr.ocrgrid.org/">WeOCR</a> でも利用できます。
-<ul>
-<li> 日本語文字行認識 - beta: &nbsp;
-  <a href="http://appsv.ocrgrid.org/nhocr/index-j.html">
-  http://appsv.ocrgrid.org/nhocr/index-j.html</a>
-</ul>
-</p>
-<p>
-このプログラムは実験的な意味が強く、
- 文字認識の精度に限界があります。<br>
-(高性能なOCRが必要ならば、製品を買うべきでしょう。)
-</p>
-<p>
-NHocr は元々、作者の週末プログラミングの成果物です。
-開発は遅いかもしれません。
-</p>
-
-
-<h2>現バージョンにおける制約事項</h2>
-
-<p>
-<ul>
-<li> ソースコードはまだ公開されていません。
-<li> 現在の NHocr は、ページレイアウトの解析処理が組み込まれていないので、
-  行イメージしか扱うことができません。
-<li> 全角・半角の文字が混在したり、プロポーショナルフォントが用いられると、
-  認識率が悪化することがあります。
-<li> 文字切り出しアルゴリズムはまだ非常に単純なので、
-  文字切り出しの精度は悪いです。
-<li> ASCII文字の認識率は悪いです。欧米言語には、例えば tesseract のような、
-  他のOCRを使うことを奨めます。
-<li> 傾き補正処理がまだ入っていません。
-<li> 言語後処理はまだ含まれていません。
-</ul>
-</p>
-
-<h2>サポートされるプラットフォームと要件</h2>
-<p>
-後に決定の予定です。<br>
-現在のα版はLinux上で走っています。
-最低限 Solaris と Linux はサポートされる予定です。
-</p>
-
-
-<a name="download"/>
-<h2>コードの入手性</h2>
-
-<p>
-開発がまだ初期の段階なので、当面の間、
- ソースコードは共同研究者のみに公開の予定です。
-一般へのソース公開は 2009.2Q に予定されています。
-</p>
-<p>
-NHocr で用いられている文字特徴量は、
- '90年代後半に堀らによって提案された
- 外郭局所モーメント特徴 (Peripheral Local Moment, P-LM)
- が基本になっています。
-現在、文字特徴量の抽出のためのコードは、
-<a href="http://code.google.com/p/nhocr/">Google Code のサイト</a>にて
-ダウンロード可能です。
-</p>
-
-
-<a name="license"/>
-<h2>ライセンス</h2>
-
-<p>
-後に決定の予定です。<br>
-MIT-Xの派生、BSD、Apache2.0のいずれかになる予定です。
-</p>
-
-
-<hr>
-&copy; 2008 &nbsp; <a href="http://www.sc.isc.tohoku.ac.jp/~hgot/">Hideaki Goto</a>
-
-</body>
-</html>
+<html>
+<head>
+<meta http-equiv="Content-Type" content="text/html;charset=EUC-JP">
+<style type="text/css">
+  h1 {text-align: left}
+  h2 {text-align: left}
+  .stext {font-size: small;}
+</style>
+<title>NHocr - the Japanese OCR - Project Home</title>
+</head>
+<body bgcolor="#f4f4f4">
+<h1>NHocr - 日本語文字認識プログラム</h1>
+
+<p>Since Sep 8, 2008 / Last update: Sep 13, 2008</p>
+
+<hr width="100%"/>
+<p>
+この文書は<a href="http://code.google.com/p/nhocr/">
+nhocr: OCR engine for Japanese language</a> (Google Code)
+にある紹介文を日本語訳し、若干の変更を加えたものです。
+</p>
+
+
+<a name="introduction"/>
+<h2>NHocrについて</h2>
+
+<p>
+NHocr は日本語に対応したコマンドライン形式の
+文字認識(OCR)プログラムです。
+NHocr は画像中の日本語文字やASCII文字/シンボルを認識します。
+NHocr はフリーのオープンソースな
+OCRソフトウェアとしてリリースされる予定です。
+</p>
+<p>
+NHocr はウェブサービス
+ <a href="http://weocr.ocrgrid.org/">WeOCR</a> でも利用できます。
+<ul>
+<li> 日本語文字行認識 - beta: &nbsp;
+  <a href="http://appsv.ocrgrid.org/nhocr/index-j.html">
+  http://appsv.ocrgrid.org/nhocr/index-j.html</a>
+</ul>
+</p>
+<p>
+このプログラムは実験的な意味が強く、
+ 文字認識の精度に限界があります。<br>
+(高性能なOCRが必要ならば、製品を買うべきでしょう。)
+</p>
+<p>
+NHocr は元々、作者の週末プログラミングの成果物です。
+開発は遅いかもしれません。
+</p>
+
+
+<h2>現バージョンにおける制約事項</h2>
+
+<p>
+<ul>
+<li> ソースコードはまだ公開されていません。
+<li> 現在の NHocr は、ページレイアウトの解析処理が組み込まれていないので、
+  行イメージしか扱うことができません。
+<li> 全角・半角の文字が混在したり、プロポーショナルフォントが用いられると、
+  認識率が悪化することがあります。というか、します。
+<li> 文字切り出しアルゴリズムはまだ非常に単純なので、
+  文字切り出しの精度は悪いです。
+<li> ASCII文字の認識率は悪いです。欧米言語には、例えば tesseract のような、
+  他のOCRを使うことを奨めます。
+<li> 傾き補正処理がまだ入っていません。
+<li> 言語後処理はまだ含まれていません。
+</ul>
+</p>
+
+<h2>サポートされるプラットフォームと要件</h2>
+<p>
+後に決定の予定です。<br>
+現在のα版はLinux上で走っています。
+最低限 Solaris と Linux はサポートされる予定です。
+</p>
+
+
+<a name="download"/>
+<h2>コードの入手性</h2>
+
+<p>
+開発がまだ初期の段階なので、当面の間、
+ ソースコードは共同研究者のみに公開の予定です。
+一般へのソース公開は 2009.2Q に予定されています。
+</p>
+<p>
+NHocr で用いられている文字特徴量は、
+ '90年代後半に堀らによって提案された
+ 外郭局所モーメント特徴 (Peripheral Local Moment, P-LM)
+ が基本になっています。
+現在、文字特徴量の抽出のためのコードは、
+<a href="http://code.google.com/p/nhocr/">Google Code のサイト</a>にて
+ダウンロード可能です。
+</p>
+
+
+<a name="license"/>
+<h2>ライセンス</h2>
+
+<p>
+後に決定の予定です。<br>
+MIT-Xの派生、BSD、Apache2.0のいずれかになる予定です。
+</p>
+
+
+<hr>
+&copy; 2008 &nbsp; <a href="http://www.sc.isc.tohoku.ac.jp/~hgot/">Hideaki Goto</a>
+
+</body>
+</html>