[groonga-dev,04553] Re: JSONB や 配列フィールドについての pgroonga インデックス作成時間および、jsonb のフェッチについて

Back to archive index

Kouhei Sutou kou****@clear*****
2017年 12月 3日 (日) 15:38:16 JST


須藤です。

In <022101d36aeb$d62d2ce0$828786a0$@mirror.ocn.ne.jp>
  "[groonga-dev,04552] Re: JSONB や 配列フィールドについての pgroonga インデックス作成時間および、jsonb のフェッチについて" on Sat, 2 Dec 2017 06:32:06 +0900,
  内山敏郎 <toshio_uchiy****@mirro*****> wrote:

>>text[]の方がtextより遅いやつは、まず、PostgreSQLのデータを
>>Groongaにコピーしているところで遅かったです。textだと
>>Zstandardを使った圧縮が効くから速いのかもしれないんですが、
>>どうしてtextの方が速いかは未確認です。これから確認します。
> 
>  この件ですが、データ投入プログラムにバグがあり、ごみの
> 入ったデータにインデックスをつけていました。データ量が
> 何倍になっているかははっきりとはわかっていませんが、
> かなり多いと考えています。
>  測定環境が会社にありますので、休み明けに出勤したら
> 再測定します。

あ、そうなんですね。

私の手元で確認した感じだと圧縮は関係なくて、PostgreSQLから
Groongaにデータをコピーしているところで遅そうでした。そう判
断した理由ですが、Groongaレベルでデータをコピーしたら数分で
終わったからです。PostgreSQLからGroongaへのコピーは確かに10
時間ちょいかかりました。


PGrnBuildCallbackRawでMemoryContextSwitchToしているのが遅く
なっている原因なのかなぁ。でも、これをやめるとメモリー使用量
がもりもり増えるんだよなぁ。


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
OSS開発支援サービス:
  http://www.clear-code.com/blog/2016/6/27.html




groonga-dev メーリングリストの案内
Back to archive index