null+****@clear*****
null+****@clear*****
2011年 3月 8日 (火) 11:38:11 JST
Kouhei Sutou 2011-03-08 02:38:11 +0000 (Tue, 08 Mar 2011) New Revision: 6332914215a0c67ed2a02b51e3edc73847c6d74e Log: fix a typo. Modified files: doc/ja/source/troubleshooting/different_results_with_the_same_keyword.txt Modified: doc/ja/source/troubleshooting/different_results_with_the_same_keyword.txt (+1 -1) =================================================================== --- doc/ja/source/troubleshooting/different_results_with_the_same_keyword.txt 2011-03-04 07:10:39 +0000 (dcc8681) +++ doc/ja/source/troubleshooting/different_results_with_the_same_keyword.txt 2011-03-08 02:38:11 +0000 (7aba64e) @@ -102,7 +102,7 @@ TokenMecabトークナイザーは事前に準備した辞書を用いてトー この場合はスコアが11になっています。内訳は、Terms.blog_body索引(TokenMecabトークナイザーを使用)でマッチしたので10、Bigram.blog_body索引(TokenBigramトークナイザーを使用)でマッチしたので3、これらを合計して13になっています。このようにTokenMecabトークナイザーの重みを高くすることにより、検索ノイズが上位にくることを抑えつつ再現率を上げることができます。 -この例は日本語だったのですが、TokenBigramトークナイザーでよかったのですが、アルファベットの場合はTokenBigramSplitSymbolAlphaトークナイザーなども利用する必要があります。例えば、「楽しいbilliard」はTokenBigramトークナイザーでは +この例は日本語だったのでTokenBigramトークナイザーでよかったのですが、アルファベットの場合はTokenBigramSplitSymbolAlphaトークナイザーなども利用する必要があります。例えば、「楽しいbilliard」はTokenBigramトークナイザーでは 楽し / しい / billiard