[groonga-dev,04398] 日本語、英語、仏語のまざった文章で複数形や過去形をフォローできますでしょうか

Back to archive index

toshio_uchiy****@mirro***** toshio_uchiy****@mirro*****
2017年 7月 17日 (月) 06:58:22 JST


メーリングリストの皆様

 

 お世話になります。内山と申します。

 日本語、英語、フランス語の短いセンテンスが

たくさんあります。これに、PGroonga で索引をつけ

PostgreSQL で全文検索しています。 トークナイザーは

TokenMecab です。

検索を実行するサイトでは、日本語、英語、フランス語

で検索できます。と謳うつもりです。

 この時、英語を例にとると、dependency と dependencies

は別々に検索しないとヒットしないようです。以前より気に

なってました。

 Google では、単数形で検索すれば複数形もヒットするように

見えました。

 仕組みとしては、単数形と複数形の辞書、過去形や過去分詞と

現在系の辞書を持てば何とかなりそうな気がしてしまいます。

 今回、日本語と英語に加えて、フランス語の文章も全文検索

の対象に加えたので、男性、中性、女性などの型も気になり、

少しここを調べようと思いググってみました。しかし、groonga

full text search で検索しても、これだという情報を見つける

ことができませんでした。

今回の疑問について参考となるサイトなどありましたら、

教えていただけますでしょうか。

 よろしくお願いします。

 

-------------- next part --------------
HTMLの添付ファイルを保管しました...
Download 



groonga-dev メーリングリストの案内
Back to archive index