[groonga-dev,04308] Re: よろしくお願いします。

Back to archive index

Kentaro Hayashi hayas****@clear*****
2017年 3月 31日 (金) 11:18:29 JST


林です。


On Thu, 30 Mar 2017 14:59:59 +0900
<toshio_uchiy****@mirro*****> wrote:

> 先ほど、groong のメーリングリストに加入させていただいた内山と申します。
> よろしくお願いします。
>
> talk がなくて、dev に入会してしまったようですが、大丈夫でしょうか。

talkは英語圏の人を対象としたメーリングリストなので、groonga-devへの入会であっています。

> 早速ですが、PGroonga について質問させてください。場違いでしたら
> 返信なしでも構いません。
>
> PGroonga のページ
>
> https://pgroonga.github.io/ja/overview/
>
> を拝見すると、
>
> 「ソースコードを変更しなくてもあらゆる言語をサポートした全文検索を実現できま
> す」
>
> と書いてあります。この点について質問させてください。
>  PostgreSQL 9.4 あるいは 9.5 系で、日本語や英語 200文字 x 5000万行(initdb
> は、UTF8)
> 程度のデータに全文検索用のインデックスを付けた時、何も気にせず検索語にローマ
> 字数文字、
> ひらがな数文字を使っても問題ないでしょうか。


問題ないです。PGroongaはいい感じに全文検索できるようなデフォルト値を設定しているからです。

PGroongaを使うためのチュートリアルがあるのでまずはこちらをひと通り試されることをおすすめします。
  https://pgroonga.github.io/ja/tutorial/


>  現在、漢字2文字だと早くて(わたくしの環境では、1ミリ秒以下)ローマ字5文字
> apple だと遅い
> (わたくしの環境では、200ミリ秒程度)という傾向が見られます。
>  できれば、200文字 x 5000万行(ローマ字、ひらがな、カタカナ、漢字が混じって
> いる)で
> ローマ字の単語、ひらがなの単語、漢字の単語で検索した時に、どれも、1ミリ秒を
> 切って0.x ミリ秒
> だと助かります。
>  マシンは、Fujitsu TX1310 M1、メモリー 32GB(アドテックのサーバー用)、HDD
> WD 1TBミラーリング
> (RAIDサーバー用 2 台)です。CPU は、Celeron G1820 です。
>  アドバイスあれば助かります。よろしくお願いします。

こちらについては、内山さんの環境で実際に試されないことにはなんとも言えません。。。
実際に試してみた結果こうだった、どうするといいでしょう?という疑問についてなら
識者からのアドバイスがもらえるかもしれません。


--
Kentaro Hayashi <hayas****@clear*****>
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: 無し
型:         application/pgp-signature
サイズ:     833 バイト
説明:       無し
Download 



groonga-dev メーリングリストの案内
Back to archive index