[groonga-dev,04463] Re: 日本語、英語、仏語のまざった文章で複数形や過去形をフォローできますでしょうか

Back to archive index

Kouhei Sutou kou****@clear*****
2017年 9月 8日 (金) 23:09:41 JST


須藤です。

In <011501d3283e$21c15c80$65441580$@mirror.ocn.ne.jp>
  "[groonga-dev,04459] Re: 日本語、英語、仏語のまざった文章で複数形や過去形をフォローできますでしょうか" on Fri, 8 Sep 2017 10:02:24 +0900,
  <toshio_uchiy****@mirro*****> wrote:

> もしかして、カラム毎にファイルが分かれているのでしょうか。

はい、そうです。

> Postgres でのカラム名と groonga でのカラム名の対応表って
> どこかにありますでしょうか?

対応表というか調べることはできます。
pgroonga_table_name()でPostgreSQLのインデックス名からGroonga
のテーブル名を取得して、あとはそこからGroongaのコマンド
(table_listやcolumn_list)で芋づる式に辿っていくことになり
ます。
  https://pgroonga.github.io/ja/reference/functions/pgroonga-table-name.html

> cat pgrn.必要としているカラムのファイル > /dev/null
> 
> すれば良い。ということでしょうか。

それは面倒なので、まず、

  cat pgrn* > /dev/null

で、全部メモリーに載せて、その後、転置インデックス用のファイ
ルだけ再度メモリーに載せるのがよいと思います。
1つの転置インデックスには複数のファイルが紐付いています。そ
れらを見分けるためには、まず、名前の最後に.cがついているファ
イルを見つけます。見つけたらそのファイルから.cを抜きます。す
るとpgrn.XXXXXXX(XXXXXXXは16進数)という名前ができます。こ
の名前から始まるファイル全部が1つ転置インデックスのファイル
です。なので、以下のようにすると転置インデックスのファイルを
メモリーに載せられます。

  for c in pgrn*.c; do
    cat $(echo $x | sed -e 's/\.c$//g')* > /dev/null
  done


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
OSS開発支援サービス:
  http://www.clear-code.com/blog/2016/6/27.html




groonga-dev メーリングリストの案内
Back to archive index