[groonga-dev,04542] Re: JSONB や 配列フィールドについての pgroonga インデックス作成時間および、jsonb のフェッチについて

Back to archive index

Kouhei Sutou kou****@clear*****
2017年 11月 26日 (日) 14:20:46 JST


須藤です。

In <004401d36673$6f9abb40$4ed031c0$@mirror.ocn.ne.jp>
  "[groonga-dev,04540] Re: JSONB や 配列フィールドについての pgroonga インデックス作成時間および、jsonb のフェッチについて" on Sun, 26 Nov 2017 14:00:10 +0900,
  内山敏郎 <toshio_uchiy****@mirro*****> wrote:

>  元メールの時間測定は、テーブルを create して、データを
> 登録してからの、インデックスを作る時間のみを測定しました。
> インデックスを定義してからのデータ投入時間ではありません。

なるほど、そうだったんですね。

> 〇その2
> 
>> create table subtitled (content text[]);
>> create index pgroonga_subtitled on subtitled using pgroonga( content );
> 
>> contentカラムだけにして実行しても再現しますか?
> 
> この件ですが、今、実行してみたところ、content カラムだけにしても
> 100分を超えました。自動アボートするかどうかは、3時間くらいみてみないと
> 分からないと思います。
> 
> となると、データの提供ということかと思いますが、お役に立つなら
> データ提供させていただきます。データは 19GB です。この前と同じで
> psql-d databasename -h hostname -U username -f filename.sql すれば
> こちらと同じテーブルが、subtitled という名前で生成されるファイルです。
> 複数カラムのテーブルです。もしよろしかったら、別メールで
> ダウンロード URL をお知らせしたいのですがよろしいでしょうか。

はい、それでお願いします。
そういえば、以前のやつ、まだできていませんでした。。。
今年中にはがんばります。。。

> 〇その4
> 
>>該当レコード1700件のidを記録しておき、
>>
>>  SELECT content WHERE id IN (...idのリスト...);
>>
>>を実行した場合も45秒くらいかかりますか?であれば、そのくらい
>>かかって普通です。
> 
> この実験は、1700個の id を記録するのに手間がかかりすぎるので
> やってません。

あれ、そうですか。私は、↓で簡単にできるかなぁと思っていたの
でした。

  SELECT id FROM subtitlec WHERE 元の条件;


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
OSS開発支援サービス:
  http://www.clear-code.com/blog/2016/6/27.html




groonga-dev メーリングリストの案内
Back to archive index