Re: shared buffers hit vs read after >cat pgrn* /dev/null (groonga-dev, 04468) - Groonga - fulltext search engine.

須藤さま

　お世話になります。内山です。

　今、まさにそこで悩んでます。
　一つのビデオに対して、字幕を全部まとめてしまうことは
プログラムを書けばできることです。しかし、一つの字幕にたいして
その字幕の始まり時間が記憶されています。その時間で映像(file)を seek
して、頭出しをしています。
　この頭出しができるということが、現状のサービスでメリットに
なっているか。今、見定めているところです。
　頭出しをやめて、一つのビデオの一塊の字幕を検索することでも
有意義は、有意義だと思います。今までのタグ検索より、詳細な検索は
できると思います。
　ここのところは、これから、サービスをどのように発展させれいくかの
思案、判断のしどころだと思います。
　こういうわけで、今すぐ変更するわけにはいかない状況です。

-----Original Message-----
From: groon****@lists*****
[mailto:groon****@lists*****] On Behalf Of Kouhei Sutou
Sent: Monday, September 11, 2017 2:03 PM
To: groon****@lists*****
Subject: [groonga-dev, 04467] Re: shared buffers hit vs read after >cat
pgrn* /dev/null

須藤です。

In <01da01d32aa0$58c250e0$0a46f2a0$@mirror.ocn.ne.jp>
  "[groonga-dev, 04466] Re: shared buffers hit vs read after >cat pgrn*
/dev/null" on Mon, 11 Sep 2017 10:50:29 +0900,
  <toshio_uchiy****@mirro*****> wrote:

> この SQL 文の exists には少し意味がありまして、P.video = C1.video が味噌で
> す。
> 一つのビデオに平均150行くらいの字幕があります。とりあえず、search という単
語
> を含む
> 字幕のあるビデオの video ID を取得して、そのビデオの字幕から algorithm と
い
> う単語を含む
> 字幕を探すという SQL 文です。と考えています。

1つのビデオを表現するのにテーブル内に複数行があるということ
ですか？で、1つの行には字幕1行文だけが格納されているというこ
とですか？

1つのcontentに字幕を全部入れて1つのビデオを1行で表現した方が
性能がでそうだなぁと思いました。


--
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート：
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス：
  http://www.clear-code.com/recruitment/
OSS開発支援サービス:
  http://www.clear-code.com/blog/2016/6/27.html

_______________________________________________
groonga-dev mailing list
groon****@lists*****
https://lists.osdn.me/mailman/listinfo/groonga-dev

Groonga - fulltext search engine.

[groonga-dev, 04468] Re: shared buffers hit vs read after >cat pgrn* /dev/null