Project Description

情報統計に関する各種ライブラリを提供します。

現在は英語の文書を対象としてプログラムの整備を行っていますが、要望があれば(そして自身に余裕ができれば)多言語対応も行っていこうと考えています。

ライブラリの構成は、基本的には以下の3つです。

  1. 文書内に含まれる単語数などを管理する言語モデル(LangModel)。情報統計を行う実際の文書を、まずこの形式に変換します。
  2. 語幹解釈クラス(Stemmer)。主語や時制により変化する単語の形式を、統計を取りやすくするために標準的な形式に変換します。
  3. 評価値算出クラス(ScoringMethod)。言語モデルに対して、クエリを適用した時の評価値を算出します。

Install

jar形式で提供しているため、Javaの動作する環境でクラスパスに含めて頂ければすぐに利用できます。 まずは、ファイルをダウンロードしてお試しください。 Show How to Install

Download

Review
Your rating
Review this project

Statistics

Recent Activities

2012-06-14
2011-09-11
00:04
sticktools
[SVN] Commit revision 17
javadocの修正、toStringの実装修正
2011-09-10
23:50
sticktools
[SVN] Commit revision 16
toStringメソッドで返す文字列を修正
2011-06-05
Show history