Develop and Download Open Source Software

View INSTALL

category(Tag) tree

file info

category(Tag)
root
file name
INSTALL
last update
2007-03-02 16:13
type
HTML
editor
Masatake Iwasaki
description
Ludiaのインストール方法についての説明です。
language
Japanese
translate

Ludia 1.0.0 インストールガイド

必要なソフトウェアの入手

Ludiaが必要とするソフトウェアを下記のURLから入手してインストールする必要があります。 (MeCabは形態素解析による分かち書きを利用する場合にのみ必要です。)

それぞれのソースアーカイブを入手し、インストールを行ってください。 withdepsパッケージをダウンロードした場合は、 depsディレクトリ下にMeCab、MeCab辞書、Sennaのソースアーカイブが入っています。

動作確認はそれぞれ以下のバージョン用いて行われました。

  • PostgreSQL 8.2.3 (8.1.8)
  • senna-1.0.1
  • mecab-0.93
  • mecab-ipadic-2.7.0-20060707

MeCabとSennaのインストール方法については、以下でも簡単に説明します。

MeCabのインストール

分かち書き方式に形態素解析を利用しない場合は、 MeCab(と辞書)をインストールする必要はありません。 その場合はSennaのインストールに進んでください。 (MeCabをインストールしない場合はSennaのインストールの際に、 --without-mecabオプションを指定する必要があります。)

MeCabをインストールする場合は、 アーカイブを展開し、以下の要領でビルドとインストールを行います。:

$ ./configure --with-charset=utf8
$ make
$ su
# make install

MeCab辞書のインストール

アーカイブを展開し、以下の要領でビルドとインストールを行います。:

$ ./configure --with-charset=utf8
$ make
$ su
# make install

Sennaのインストール

アーカイブを展開し、以下の要領でビルドとインストールを行います。:

$ ./configure
$ make
$ su
# make install

ただし、MeCabをインストールしていない場合には、 --without-mecab オプションを指定する必要があります。:

$ ./configure --without-mecab

インストール後に、 $SENNA_HOME ディレクトリと設定ファイルを作成します。:

# mkdir /var/senna
# echo "DEFAULT_ENCODING utf8" > /var/senna/senna.conf

SENNA_HOMEディレクトリはデフォルトでは /var/senna になっていますが、 この場所は configure の際に --with-sennahome オプション で指定できます。

設定ファイルについては、指定するエンコーディングが MeCabで設定したエンコーディングと一致しているように注意してください。

また、Sennaは $SENNA_HOME/log/senna.log というファイルにログを出力します。 ログを取得したい場合は、ログフォルダを作成し、 PostgreSQLサーバの実行ユーザが書き込みをできるように権限を設定してください。:

# mkdir /var/senna/log
# chown postgres:postgres /var/senna/log

環境によっては nfkc.c のコンパイルに非常に時間がかかる場合があります。 この場合、:

$ ./configure --disable-nfkc

のようなオプションでUnicode文字列の正規化機能を無効にすることで、 スキップできます。(http://qwik.jp/senna/FAQ.html)

Ludiaのインストール

アーカイブを展開し、以下の要領でビルドとインストールを行います。:

$ ./configure
$ make
$ su
# make install

pg_configコマンド、senna-cfgコマンドのインストール先にPATHが設定されていない場合、 以下のようにそれぞれのpathをconfigureオプションで指定してください。:

$ ./configure --with-pg-config=/usr/local/pgsql/bin/pg_config \
              --with-senna-cfg=/usr/local/bin/senna-cfg

Xpdfのインストール

Xpdfについてはテキストフィルタ関数を利用する場合にのみインストールが必要です。 ここでは簡単に手順を説明しますが、 詳細については XpdfのWebサイト を参照してください。

まず、ソースアーカイブを展開し、patchをあててから、configureとmakeを実行します。:

$ tar -zxvf xpdf-3.01.tar.gz
$ cp xpdf-3.01pl2.patch ./xpdf-3.01
$ cd xpdf-3.01
$ patch -c -p1 < xpdf-3.01pl2.patch
$ ./configure
$ make
$ sudo make install

また、日本語を扱うためにはLanguage Support Packagesが必要なので、 こちらもダウンロードしてインストールします。:

$ tar -zxvf xpdf-japanese.tar.gz
# mkdir /usr/local/share/xpdf
# mkdir /usr/local/share/xpdf/japanese
# mv xpdf-japanese/* /usr/local/share/xpdf/japanese/
# cat /usr/local/share/xpdf/japanese/add-to-xpdfrc >> /usr/local/etc/xpdfrc

インストール後に、設定ファイルの内容を編集します。 テキストフィルタ関数ではpdftotextのコマンドライン引数を指定できないので、 ここで出力ファイルの文字コードと改行コードなどを指定する必要があります。:

# Choose a text encoding for copy-and-paste and for pdftotext output.
# The Latin1, ASCII7, and UTF-8 encodings are built into Xpdf.  Other
# encodings are available in the language support packages.

textEncoding            UTF-8

# Choose the end-of-line convention for multi-line copy-and-past and
# for pdftotext output.  The available options are unix, mac, and dos.

textEOL         unix

また、インストール先を /usr/local/share/xpdf/japanese 以外にした場合は、 以下の部分も修正が必要になります。:

#----- begin Japanese support package (2004-jul-27)
cidToUnicode    Adobe-Japan1    /usr/local/share/xpdf/japanese/Adobe-Japan1.cidToUnicode
unicodeMap      ISO-2022-JP     /usr/local/share/xpdf/japanese/ISO-2022-JP.unicodeMap
unicodeMap      EUC-JP          /usr/local/share/xpdf/japanese/EUC-JP.unicodeMap
unicodeMap      Shift-JIS       /usr/local/share/xpdf/japanese/Shift-JIS.unicodeMap
cMapDir         Adobe-Japan1    /usr/local/share/xpdf/japanese/CMap
toUnicodeDir                    /usr/local/share/xpdf/japanese/CMap
#displayCIDFontTT       Adobe-Japan1    /usr/..../kochi-mincho.ttf
#----- end Japanese support package