[groonga-dev,04838] Re: 参照されることが多い記事のスコアを上げたい

Back to archive index
shinonon shino****@jcom*****
2021年 3月 23日 (火) 06:55:02 JST


各務さん
アドバイスをいただき、ありがとうございます。

> そうですねぇ、この方向性だと必要なものは 参照側の Message-Id 毎の重み
> ではないかと思いました。まずは Count にすると思います。

なるほど。
今まで Mail テーブル内で実現することしか考えていませんでしたが、
Messageidテーブルを別に作ってそちらで重みをカウントするということですね。
目からウロコです。

Mail 検索時に Messageid テーブルの重みを活用するには、何かしら関数を駆使
して Messageid(Mail.messageid).weight というような感じで参照することにな
るのでしょうか?

> P.S
> > Web掲示板やコミュニケーションツールでよくある
> 
> view や click 取る方が確実ではありますね。
> gmail だと重要とかお気に入りとか。

そうですね。
実は今回、「参照されることが多い記事のスコアを上げたい」ということを考え
たのは、以前(今でも基本は同じだと思いますが) Google では「リンクが貼られ
た記事のスコアは高い」ということを行っていたのがキッカケではありますが、
もう一つ理由があります。
それは、主にビジネスメールでは返信時に全文引用が行われることが多いため、
メール内の言葉で検索すると、全文引用内で引っかかった言葉が全て引っかかり、
それがいわゆる"ノイズ"になってしまうので、それをなんとか排除できないか、
ということも考えています。
したがって、「検索条件で検索したメールの中で、トップのメールのみを集め、
そのトップに対して返信されたメールを除去」ということができればいいなぁ、
ということも考えています。ただこれは、重み付けだけではなかなか実現できな
く、select した結果を元にさらに個別に select する、という作業が必要にな
ると思われるため、どうすればいいか悩んでいるところではあります。


-- 
篠田 敦
shino****@jcom*****



groonga-dev メーリングリストの案内
Back to archive index