[groonga-dev,04305] よろしくお願いします。

Back to archive index

toshio_uchiy****@mirro***** toshio_uchiy****@mirro*****
2017年 3月 30日 (木) 14:59:59 JST


先ほど、groong のメーリングリストに加入させていただいた内山と申します。
よろしくお願いします。

talk がなくて、dev に入会してしまったようですが、大丈夫でしょうか。

早速ですが、PGroonga について質問させてください。場違いでしたら
返信なしでも構いません。

PGroonga のページ

https://pgroonga.github.io/ja/overview/

を拝見すると、

「ソースコードを変更しなくてもあらゆる言語をサポートした全文検索を実現できま
す」

と書いてあります。この点について質問させてください。
 PostgreSQL 9.4 あるいは 9.5 系で、日本語や英語 200文字 x 5000万行(initdb
は、UTF8)
程度のデータに全文検索用のインデックスを付けた時、何も気にせず検索語にローマ
字数文字、
ひらがな数文字を使っても問題ないでしょうか。
 現在、漢字2文字だと早くて(わたくしの環境では、1ミリ秒以下)ローマ字5文字
apple だと遅い
(わたくしの環境では、200ミリ秒程度)という傾向が見られます。
 できれば、200文字 x 5000万行(ローマ字、ひらがな、カタカナ、漢字が混じって
いる)で
ローマ字の単語、ひらがなの単語、漢字の単語で検索した時に、どれも、1ミリ秒を
切って0.x ミリ秒
だと助かります。
 マシンは、Fujitsu TX1310 M1、メモリー 32GB(アドテックのサーバー用)、HDD
WD 1TBミラーリング
(RAIDサーバー用 2 台)です。CPU は、Celeron G1820 です。
 アドバイスあれば助かります。よろしくお願いします。




groonga-dev メーリングリストの案内
Back to archive index