Ticket #9738

検索のバグをみつかりました。お願いします。
Open Date: 2007-01-08 19:56 Last Update: 2007-01-11 12:42

Reporter:
(Anonymous)
Owner:
(None)
Type:
Status:
Open
Component:
(None)
MileStone:
(None)
Priority:
5 - Medium
Severity:
5 - Medium
Resolution:
None
File:
None

Details

こんにちわ
クラフトと申します。先、他のところに書き込みしてしまい
ました。申し訳ありませんでした。
僕のプログラムはludia を使っています。データベースは
postgresql 8.1.4、 エンコーディング はEUC-JPです。
バージョン0.8 と 0.9 、両方試しました。早かったのは確
実ですが、問題が以下のようにあります。
1.カナで検索すると検索結果が実際の数より少ないです。
「インポートレコード」という言葉で試しました。手順とは
まずデータベースに今の言葉を登録して、「インポート」で
検索しました。そしたら「インポートレコード」のレコード
が出てきませんでした。
ですが、「インポート」と「レコート」の間に空白を入れる
と、検索に引っかかりました。
どんな手順で修正すれば、直るんですか?

よろしくお願いします。
czarft@gmail.com

Ticket History (2/2 Histories)

2007-01-11 11:26 Updated by: co-saka
Comment
Logged In: YES
user_id=23292

報告ありがとうございます。

クラフトさんの環境でわからない点があるので、
以下の条件を仮定してコメントさせていただきます。

・形態素(fulltext)を使用
・「インポート」と「レコート」の間に空白を入れる
 ↓
 データベースの「インポートレコード」の間に空白を入れる。
 (検索クエリで「インポート レコード」ではない。)


形態素を使用した場合は、検索結果が少ない場合は、
検索方法をより詳細にして、再検索するという仕様になっており
ます。
参考:http://qwik.jp/senna/query.html

常に検索でヒットさせたい場合は、
SELECT * FROM tab WHERE col @@ '*E-7 インポート';
として、最初から詳細な検索を行うか、
N-gram(fulltextb)を用いれば良いと思います。


また、EUC-JPを使用しているようですが、
mecab, sennaの文字コードもEUC-JPに設定しているでしょうか。
今、一度ご確認していただければと思います。
2007-01-11 12:42 Updated by: None
Comment
Logged In: NO

ありがとうございます。
mecab, sennaの文字コードもEUC-JPに設定しています。

Attachment File List

No attachments

Edit

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Login