[groonga-dev,04821] [ANN] Groonga 10.0.7

Back to archive index
Horimoto Yasuhiro horim****@clear*****
2020年 9月 30日 (水) 18:07:05 JST


こんばんは。堀本です。

Groonga 10.0.7 をリリースしました!

    https://groonga.org/ja/docs/news.html#release-10-0-7

変更点一覧:

    https://groonga.org/ja/blog/2020/09/29/groonga-10.0.7.html

## 主な変更内容

* [highlight], [highlight_full] ノーマライザーにオプションを指定できるようになりました。

* [リターンコード] 新しいリターンコード GRN_CONNECTION_RESET を追加しました。

  * このリターンコードは、リモートホストから強制的に接続を切断されたときに返されます。

* Ubuntu 19.10(Eoan Ermine)のサポートをやめました。

  * このバージョンはEOLになっているためです。

* [httpd] バンドルしているnginxのバージョンを1.19.2に更新しました。

* [grndb] キーの重複を検出できるようになりました。

  * 今回のリリースから、 grndb check でキーの重複も検出できるようになりました。
  * このチェックは、 TABLE_NO_KEY のテーブル以外で有効です。
  * grndb check で重複が検出されたテーブルにインデックスカラムしかない場合は、 grndb recover で復旧できます。

* [table_create], [column_create] 新しいオプション --path を追加しました。

  * このオプションによって指定したテーブルまたは、カラムを任意のパスに格納できます。
  * このオプションは、高速なストレージ(SSDなど)によく使うテーブルやカラムを格納し、低速なストレージ(HDDなど)にあまり使わないテーブルやカラムを格納したいときに有用です。
  * このオプションは、相対パス、絶対パスの両方が指定できます。

    * 相対パスを指定した場合は、 groonga プロセスのパスを起点に指定したパスが解決されます。

  * --path を指定した場合、 dump コマンドの結果に --path の情報が含まれます。

    * したがって、 --path を指定した場合、 異なる環境のホストではリストアできなくなります。

      * これは、ディレクトリ構成や groonga プロセスの場所が環境ごとに異なるためです。

    * --path の情報を dump に含みたくない場合は、 dump コマンド実行時に --dump_paths no を指定する必要があります。

* [dump] 新しいオプション --dump_paths を追加しました。

  * --dump_paths オプションは、 --path をダンプするかどうかを制御します。
  * デフォルト値は yes です。
  * もし、テーブルやカラム作成時に --path を指定していて、 --path の情報を dump に含みたくない場合は、 dump コマンド実行時に --dump_paths に no を指定してください。

* 新しい関数 string_toknize() を追加しました。

  * この関数は、第二引数に指定されたカラムの値を、第一引数に指定されたトークナイザーでトークナイズします。

* [tokenizers] 新しいトークナイザー TokenDocumentVectorTFIDF を追加しました。(実験的)

  * このトークナイザーは、TF-IDFで文書ベクトルを自動で生成します。

* [tokenizers] 新しいトークナイザー TokenDocumentVectorBM25 を追加しました。(実験的)

  * このトークナイザーは、BM25で文書ベクトルを自動で生成します。

* [select] 同一センテンス内での、フレーズ近傍検索をサポートしました。

* [load] 257個のカラムに対して load を実行すると load の応答が返らなくなる問題を修正しました。

  * この問題は、10.0.4以降で発生する可能性があります。
  * この問題は、 [a, b, c, ...] の形式でデータをロードした時にのみ発生します。

    * [{...}] を使ってデータをロードした場合は発生しません。

* [MessagePack] float32の値を正しくアンパックできない問題を修正しました。

* マルチカラムインデックス関連の問題を修正しました。

  * _score の値が壊れることがあります。
  * ヒットしないはずのレコードがヒットすることがあります。
  * この問題の発生条件については、以下のURLを参照してください。

    * https://groonga.org/ja/blog/2020/09/29/groonga-10.0.7.html#multi-column-index



groonga-dev メーリングリストの案内
Back to archive index