Hiroyuki Sato
hiroy****@gmail*****
2015年 12月 12日 (土) 17:48:15 JST
佐藤です。
わかったことを自己フォローします。
1, インデックスの保存場所
(1) groongaのデータはどこに保存されますか?
=> $PGDATA/xx/grnXXXというファイルができます。
(2) パスは変更可能でしょうか?
・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。
=> create index ... tablespace
XXXとやってみたのですが、別のテーブルスペースにインデックスを作ってくれない?ようです。
やり方が悪いのかな?..もう一度確認します。
もう一つ、ディスクが溢れた時のインデックスの削除の仕方を教えてください。
drop extension pgroonga cascade;
rm -f $PGDATA/*/grn*
で良いでしょうか?
インデックスをかけてみたところ、案の定、$PGDATAの領域はディスク容量がすくなく
ディスク容量が溢れました。
drop extension pgroonga cascadeを実行してgroonga関連のデータを消しました。
groongaのデータは消えてくれず、おそらくvacuumしないとダメなんだろうなと思い、
vacuum fullを実行しましたが、容量が足りなくて、vacuumできませんでした。
仕方がないので、(壊れるのを承知で)、rm -f $PGDATA/*/grn*を実行しました。
その後PostgreSQLを再起動しました。
とりあえず動いているようです。
よろしくお願いします。
2015年12月11日(金) 21:35 Hiroyuki Sato <hiroy****@gmail*****>:
> PGroongaを使おうかと検討中です。
>
>
> 次のことについて教えてください
> やりたいことは次のようなものです。
>
> * URLの検索
> - 前方一致・部分一致: url like '%/a/b/c'
> - 完全一致: url = 'http://pgroonga.github.io'
> * 日本語: なし
>
> 質問事項
>
> 1, インデックスの保存場所
> (1) groongaのデータはどこに保存されますか?
> (2) パスは変更可能でしょうか?
> ・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。
>
> 2, ASCIIだけでもpgroonga使った方がいいですよね?
> ASCIIだけでも、pg_trigm, pg_bigmよりも速いでしょうか?
>
> http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/
> 17ページを見る限り、Groongaを使った方が良さそうですよね。
>
> 3, パーティションテーブル(inheritされたデーブル)
>
> URLのデータは日別のパーティションテーブルに格納しています。
> インデックスをかける場合は、継承したテーブル個々に
> using groongaでインデックスを作成すれば良いでしょうか?
>
> 4, 完全一致
>
> 完全一致の時もPGroongaのインデックスが使われますでしょうか?
>
> 5, URL用のトークナイザーとノーマライザー
> ノーマライザーなしの、 TokenBigramが良いでしょうか?
>
> Groongaの場合、NormalizeAutoにしたらASCIIは単語の境界でトークナイズされると
> 学んだように記憶しています。
>
> URLは単純なバイグラム(あるいは大文字を小文字に変換)にするのが検索に向いている
> 思います。
>
> と思ったのですが、NormalizerNoneという指定はないように思います。
> http://groonga.org/ja/docs/reference/normalizers.html
>
> どのようにするのが良いでしょうか?
>
> 背中を押してください。
> よろしくお願いします。
>
>
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download