[groonga-dev,03263] Re: TokenTrigramを使った環境での2文字検索について

Back to archive index

Naoya Murakami visio****@gmail*****
2015年 5月 21日 (木) 19:44:40 JST


村上です。

たしか、今のTokenTrigramはそんな感じでした。
(かなり久しぶりにGroongaのソース見ました)

https://github.com/groonga/groonga/blob/master/lib/token_cursor.c#L248-L250
(1個目のトークンはUNMATUREDでGRN_TOKEN_REACH_ENDですがGRN_TOKEN_LASTじゃない)

https://github.com/groonga/groonga/blob/master/lib/tokenizers.c#L433-L435

GET時のトークンが1個で、且つ、REACH_ENDの場合(字種境界じゃない場合)は、
TokenTrigramでも強制前方一致検索されるとよさそうに思いました。

以上です。


2015年5月21日 19:28 yoku ts. <yoku0****@gmail*****>:

> こんばんは、yoku0825といいます。
>
> TokenTrigramでトークナイズした文書を2文字で検索したいのですが、
> TokenTrigramって「TokenBigramに1文字の検索文字列を投げた時のように前方一致で上手くやってくれる」機能はなかったりしますか?
>
> 1文字のクエリーを投げると前方一致にすり替えてくれてそうなんですが、2文字はマッチ検索しているっぽいです。こういう仕様でしたっけ?
>
> https://gist.github.com/yoku0825/1da3aa16a2dd14e99f55
>
>
> 取り敢えずyumでmysql-community-mroongaを突っ込んだもので再現しています。
>
>
> ( ´-`).oO(TokenBigramからTokenTrigramに乗り換えようとしたら、2文字のクエリーだけ盛大におかしくて。。
> ( ´-`).oO(mroonga_match_escalation_thresholdを有効にしろとかそんな感じですかね…?
>
>
> yoku0825,
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Download 



groonga-dev メーリングリストの案内
Back to archive index