taro****@taf*****
taro****@taf*****
2005年 11月 18日 (金) 16:44:35 JST
坂本です。 From: taro****@taf***** Subject: [Senna-dev 178] Re: バージョンアップ手順 Date: Fri, 18 Nov 2005 16:03:45 +0900 > > // share->keyinfo[i].senna = sen_index_create(buf, sizeof(my_off_t), SEN_INDEX_NORMALIZE, 0, sen_enc_default); > > share->keyinfo[i].senna = sen_index_create(buf, sizeof(my_off_t), SEN_INDEX_NORMALIZE|SEN_INDEX_SPLIT_ALPHA|SEN_INDEX_SPLIT_DIGIT|SEN_INDEX_SPLIT_SYMBOL|SEN_INDEX_NGRAM, 0, sen_enc_default); > > > > こういうフラグは、 > > ビットが立ってるか立ってないかなので、| ですよ。 > > とんだ勘違いですね。コンパイルしなおしてみます。 > > SEN_INDEX_SPLIT_* > > がなにものか理解してないですが... NORMALIZE のみ -rw-rw---- 1 mysql mysql 8458240 Nov 18 16:21 urld3.002.SEN -rw-rw---- 1 mysql mysql 537464832 Nov 18 16:21 urld3.002.SEN.i -rw-rw---- 1 mysql mysql 22614016 Nov 18 16:22 urld3.002.SEN.i.c -rw-rw---- 1 mysql mysql 12652544 Nov 18 16:21 urld3.002.SEN.l -rw-rw---- 1 mysql mysql 62349552 Nov 18 16:21 urld3.MYD -rw-rw---- 1 mysql mysql 2312192 Nov 18 16:22 urld3.MYI -rw-rw---- 1 mysql mysql 8910 Nov 18 16:21 urld3.frm 全部フラグ -rw-rw---- 1 mysql mysql 8458240 Nov 18 16:19 urld3.002.SEN -rw-rw---- 1 mysql mysql 538251264 Nov 18 16:20 urld3.002.SEN.i -rw-rw---- 1 mysql mysql 8196096 Nov 18 16:20 urld3.002.SEN.i.c -rw-rw---- 1 mysql mysql 12652544 Nov 18 16:19 urld3.002.SEN.l -rw-rw---- 1 mysql mysql 62349552 Nov 18 16:19 urld3.MYD -rw-rw---- 1 mysql mysql 2312192 Nov 18 16:20 urld3.MYI -rw-rw---- 1 mysql mysql 8910 Nov 18 16:19 urld3.frm ファイルサイズ若干違って、たしかに検索結果もちょっと違います。 ■ケース1 オリジナル文書 1610612033 検索キーワード 1610612033 どちらもあたる。 ■ケース2 オリジナル文書 1610612033 検索キーワード 161061203 どちらもあたる。 ■ケース3 オリジナル文書 1610612033 検索キーワード 61061203 N-gram のみあたる。 ■ケース3 オリジナル文書 1610612033 検索キーワード 1610 N-gram のみあたる。 単語インデックスほうは前方一致で、文字列が5byte 以上なら意味のある 単語として認識するようです。