toshio_uchiy****@mirro*****
toshio_uchiy****@mirro*****
2017年 3月 31日 (金) 14:29:40 JST
林様 お世話になります。内山と申します。よろしくお願いします。 親切なご返信ありがとうございます。 PGroonga が言語によらない検索速度を実現できていることを 期待しております。中身は良くわかりません。 とりあえず、現在、テスト環境のシステムの入ったディスクが いかれており、新しいディスクが来るのが来週か再来週になる 予定です。新しいディスクが来たら、データはバックアップを とってあるので CentOS 7 と PostgreSQL 9.5 系で PGroonga を 試してみようと考えています。リリースが待たれますね。 できれば、Windows, OS X, Linux だけでなく、FreeBSD にも インストールして使えるようにしていただけるとありがたいです。 よろしくお願いします。 -----Original Message----- From: groon****@lists***** [mailto:groon****@lists*****] On Behalf Of Kentaro Hayashi Sent: Friday, March 31, 2017 11:18 AM To: groon****@lists***** Subject: [groonga-dev,04308] Re: よろしくお願いします。 林です。 On Thu, 30 Mar 2017 14:59:59 +0900 <toshio_uchiy****@mirro*****> wrote: > 先ほど、groong のメーリングリストに加入させていただいた内山と申します。 > よろしくお願いします。 > > talk がなくて、dev に入会してしまったようですが、大丈夫でしょうか。 talkは英語圏の人を対象としたメーリングリストなので、groonga-devへの入会で あっています。 > 早速ですが、PGroonga について質問させてください。場違いでしたら > 返信なしでも構いません。 > > PGroonga のページ > > https://pgroonga.github.io/ja/overview/ > > を拝見すると、 > > 「ソースコードを変更しなくてもあらゆる言語をサポートした全文検索を実現でき ま > す」 > > と書いてあります。この点について質問させてください。 > PostgreSQL 9.4 あるいは 9.5 系で、日本語や英語 200文字 x 5000万行 (initdb > は、UTF8) > 程度のデータに全文検索用のインデックスを付けた時、何も気にせず検索語にロー マ > 字数文字、 > ひらがな数文字を使っても問題ないでしょうか。 問題ないです。PGroongaはいい感じに全文検索できるようなデフォルト値を設定して いるからです。 PGroongaを使うためのチュートリアルがあるのでまずはこちらをひと通り試されるこ とをおすすめします。 https://pgroonga.github.io/ja/tutorial/ > 現在、漢字2文字だと早くて(わたくしの環境では、1ミリ秒以下)ローマ字5文 字 > apple だと遅い > (わたくしの環境では、200ミリ秒程度)という傾向が見られます。 > できれば、200文字 x 5000万行(ローマ字、ひらがな、カタカナ、漢字が混じっ て > いる)で > ローマ字の単語、ひらがなの単語、漢字の単語で検索した時に、どれも、1ミリ秒 を > 切って0.x ミリ秒 > だと助かります。 > マシンは、Fujitsu TX1310 M1、メモリー 32GB(アドテックのサーバー用)、 HDD > WD 1TBミラーリング > (RAIDサーバー用 2 台)です。CPU は、Celeron G1820 です。 > アドバイスあれば助かります。よろしくお願いします。 こちらについては、内山さんの環境で実際に試されないことにはなんとも言えませ ん。。。 実際に試してみた結果こうだった、どうするといいでしょう?という疑問についてな ら 識者からのアドバイスがもらえるかもしれません。 -- Kentaro Hayashi <hayas****@clear*****>