Project Description

Wik-IEはWikipediaで公開されているデータファイルを解析するJavaで書かれたツールです。記事やカテゴリ・リダイレクト間の関係や他言語版へのリンクなどの情報を抽出します。 Wik-IEはApache Hadoopプラットフォーム上での動作を想定していて、分散処理により高速で処理ができます。スタンドアロンでの動作も可能です。スタンドアロン動作の場合に必要なのは、WikipediaのデータファイルとWik-IEだけです。データベースを介さないのはWik-IEの特徴のひとつです。

Download

Review
Your rating
Review this project

Statistics

Recent Activities

2011-06-14
16:30
Wikipediaデータ解析ツールWik-IE
2010-11-04
19:12
Wikipediaデータ解析ツールWik-IE
19:12
Wikipediaデータ解析ツールWik-IE
2009-04-14
22:59
Wikipediaデータ解析ツールWik-IE
[CVS] New commit
2008-11-28
16:55
Wikipediaデータ解析ツールWik-IE
Show history