toshio_uchiy****@mirro*****
toshio_uchiy****@mirro*****
2017年 7月 17日 (月) 06:58:22 JST
メーリングリストの皆様 お世話になります。内山と申します。 日本語、英語、フランス語の短いセンテンスが たくさんあります。これに、PGroonga で索引をつけ PostgreSQL で全文検索しています。 トークナイザーは TokenMecab です。 検索を実行するサイトでは、日本語、英語、フランス語 で検索できます。と謳うつもりです。 この時、英語を例にとると、dependency と dependencies は別々に検索しないとヒットしないようです。以前より気に なってました。 Google では、単数形で検索すれば複数形もヒットするように 見えました。 仕組みとしては、単数形と複数形の辞書、過去形や過去分詞と 現在系の辞書を持てば何とかなりそうな気がしてしまいます。 今回、日本語と英語に加えて、フランス語の文章も全文検索 の対象に加えたので、男性、中性、女性などの型も気になり、 少しここを調べようと思いググってみました。しかし、groonga full text search で検索しても、これだという情報を見つける ことができませんでした。 今回の疑問について参考となるサイトなどありましたら、 教えていただけますでしょうか。 よろしくお願いします。 -------------- next part -------------- HTMLの添付ファイルを保管しました...Download