[groonga-dev,03264] Re: TokenTrigramを使った環境での2文字検索について

Back to archive index

yoku ts. yoku0****@gmail*****
2015年 5月 21日 (木) 19:57:44 JST


わあ、お久しぶりです :)
ありがとうございます。

このへんをホゲればいいいみたいですよ! 須藤さん! (チラッチラッ


ところで、メーリングリストのドメイン変わったんですね。
これか。。
Slashdot JapanならびにSourceForge.JP、サイト名称変更のお知らせ | OSDN株式会社
http://osdn.co.jp/press/2015/04/%E3%82%B5%E3%82%A4%E3%83%88%E5%90%8D%E7%A7%B0%E5%A4%89%E6%9B%B4%E3%81%AE%E3%81%8A%E7%9F%A5%E3%82%89%E3%81%9B


yoku0825,



2015年5月21日 19:44 Naoya Murakami <visio****@gmail*****>:
> 村上です。
>
> たしか、今のTokenTrigramはそんな感じでした。
> (かなり久しぶりにGroongaのソース見ました)
>
> https://github.com/groonga/groonga/blob/master/lib/token_cursor.c#L248-L250
> (1個目のトークンはUNMATUREDでGRN_TOKEN_REACH_ENDですがGRN_TOKEN_LASTじゃない)
>
> https://github.com/groonga/groonga/blob/master/lib/tokenizers.c#L433-L435
>
> GET時のトークンが1個で、且つ、REACH_ENDの場合(字種境界じゃない場合)は、
> TokenTrigramでも強制前方一致検索されるとよさそうに思いました。
>
> 以上です。
>
>
> 2015年5月21日 19:28 yoku ts. <yoku0****@gmail*****>:
>>
>> こんばんは、yoku0825といいます。
>>
>> TokenTrigramでトークナイズした文書を2文字で検索したいのですが、
>> TokenTrigramって「TokenBigramに1文字の検索文字列を投げた時のように前方一致で上手くやってくれる」機能はなかったりしますか?
>>
>> 1文字のクエリーを投げると前方一致にすり替えてくれてそうなんですが、2文字はマッチ検索しているっぽいです。こういう仕様でしたっけ?
>>
>> https://gist.github.com/yoku0825/1da3aa16a2dd14e99f55
>>
>>
>> 取り敢えずyumでmysql-community-mroongaを突っ込んだもので再現しています。
>>
>>
>> ( ´-`).oO(TokenBigramからTokenTrigramに乗り換えようとしたら、2文字のクエリーだけ盛大におかしくて。。
>> ( ´-`).oO(mroonga_match_escalation_thresholdを有効にしろとかそんな感じですかね…?
>>
>>
>> yoku0825,
>> _______________________________________________
>> groonga-dev mailing list
>> groon****@lists*****
>> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
>
>
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>



groonga-dev メーリングリストの案内
Back to archive index