[groonga-dev,04941] Re: pgroonga インデックス作成時の [ii][update][one] buffer is full エラー

Back to archive index
Sutou Kouhei kou****@clear*****
2022年 4月 4日 (月) 14:24:49 JST


須藤です。

In <CALHF****@mail*****>
  "[groonga-dev,04940] Re: pgroonga インデックス作成時の [ii][update][one] buffer is full エラー" on Mon, 4 Apr 2022 14:13:07 +0900,
  takashi sugaya <tsuga****@gmail*****> wrote:

> 1.データベースに登録する際、インデックスを作成する対象のカラムに対して、
> 追加するテキストのサイズは約400MBあるのですが、このサイズのテキストの索引を
> 作成することは無理があるのでしょうか?

いえ、400MBはGroongaが扱える最大データ量に比べてかなり小さい
のでサイズが問題とは思えません。

> 2.「そもそも動いていない」というのは、ログレベルをDEBUGにした場合に、
> ログの内容から分かりますでしょうか?

「nterms=XXX chunk=XXX total=XXX」というようなログがでていな
ければ動いていません。

> 3.「動いているけど十分な場所を確保できていない」とは、メモリ上に
> 確保できていないという事でしょうか?(メモリが足りていないのでしょうか?)

メモリーが足りないというわけではありません。
メモリー上に確保した領域をうまく活用できていないだけです。

> 4.本事象はインデックスが全く作成されていない状態では、発生しませんでした。
> インデックスが増えることによって、索引を作成する際に影響する内容などはございますでしょうか?

このエラーはインデックス作成・更新時に発生するのでインデック
スがない場合は発生します。

PGroongaのインデックスはそれぞれ独立しているので他のインデッ
クスの有無や数が影響しているということはありません。

> 5.CREATE INDEXを行う際に「WITH (tokenizer='TokenBigramSplitSymbolAlphaDigit')」と、
> トークナイザーを指定しておりますが、こちらも何か影響がございますでしょうか?

おそらく、この件はデータに依存して発生している事象なのですが、
トークナイザーによってインデックスの処理方法が変わるので影響
がある可能性はあります。ただ、私はどんなデータかわからないの
で確実に影響があるかどうかまではわかりません。

> 環境のメモリサイズとしては以下となります。
> Mem: 31Gi
> Swap: 9Gi

このくらいあれば余裕で扱えるデータ量です。
そのためメモリー不足が原因とは思えません。


groonga-dev メーリングリストの案内
Back to archive index