こんばんは。堀本です。
Groonga 10.0.7 をリリースしました!
https://groonga.org/ja/docs/news.html#release-10-0-7
変更点一覧:
https://groonga.org/ja/blog/2020/09/29/groonga-10.0.7.html
## 主な変更内容
* [highlight], [highlight_full] ノーマライザーにオプションを指定できるようになりました。
* [リターンコード] 新しいリターンコード GRN_CONNECTION_RESET を追加しました。
* このリターンコードは、リモートホストから強制的に接続を切断されたときに返されます。
* Ubuntu 19.10(Eoan Ermine)のサポートをやめました。
* このバージョンはEOLになっているためです。
* [httpd] バンドルしているnginxのバージョンを1.19.2に更新しました。
* [grndb] キーの重複を検出できるようになりました。
* 今回のリリースから、 grndb check でキーの重複も検出できるようになりました。
* このチェックは、 TABLE_NO_KEY のテーブル以外で有効です。
* grndb check で重複が検出されたテーブルにインデックスカラムしかない場合は、 grndb recover で復旧できます。
* [table_create], [column_create] 新しいオプション --path を追加しました。
* このオプションによって指定したテーブルまたは、カラムを任意のパスに格納できます。
* このオプションは、高速なストレージ(SSDなど)によく使うテーブルやカラムを格納し、低速なストレージ(HDDなど)にあまり使わないテーブルやカラムを格納したいときに有用です。
* このオプションは、相対パス、絶対パスの両方が指定できます。
* 相対パスを指定した場合は、 groonga プロセスのパスを起点に指定したパスが解決されます。
* --path を指定した場合、 dump コマンドの結果に --path の情報が含まれます。
* したがって、 --path を指定した場合、 異なる環境のホストではリストアできなくなります。
* これは、ディレクトリ構成や groonga プロセスの場所が環境ごとに異なるためです。
* --path の情報を dump に含みたくない場合は、 dump コマンド実行時に --dump_paths no を指定する必要があります。
* [dump] 新しいオプション --dump_paths を追加しました。
* --dump_paths オプションは、 --path をダンプするかどうかを制御します。
* デフォルト値は yes です。
* もし、テーブルやカラム作成時に --path を指定していて、 --path の情報を dump に含みたくない場合は、 dump コマンド実行時に --dump_paths に no を指定してください。
* 新しい関数 string_toknize() を追加しました。
* この関数は、第二引数に指定されたカラムの値を、第一引数に指定されたトークナイザーでトークナイズします。
* [tokenizers] 新しいトークナイザー TokenDocumentVectorTFIDF を追加しました。(実験的)
* このトークナイザーは、TF-IDFで文書ベクトルを自動で生成します。
* [tokenizers] 新しいトークナイザー TokenDocumentVectorBM25 を追加しました。(実験的)
* このトークナイザーは、BM25で文書ベクトルを自動で生成します。
* [select] 同一センテンス内での、フレーズ近傍検索をサポートしました。
* [load] 257個のカラムに対して load を実行すると load の応答が返らなくなる問題を修正しました。
* この問題は、10.0.4以降で発生する可能性があります。
* この問題は、 [a, b, c, ...] の形式でデータをロードした時にのみ発生します。
* [{...}] を使ってデータをロードした場合は発生しません。
* [MessagePack] float32の値を正しくアンパックできない問題を修正しました。
* マルチカラムインデックス関連の問題を修正しました。
* _score の値が壊れることがあります。
* ヒットしないはずのレコードがヒットすることがあります。
* この問題の発生条件については、以下のURLを参照してください。
* https://groonga.org/ja/blog/2020/09/29/groonga-10.0.7.html#multi-column-index