Yasuhiro Horimoto 2018-12-28 12:14:44 +0900 (Fri, 28 Dec 2018) Revision: 564d25a3191d468fcddbdef3dd2c8e1902de14eb https://github.com/groonga/groonga/commit/564d25a3191d468fcddbdef3dd2c8e1902de14eb Message: doc ja: translate about tokenizers and tokenfilters Modified files: doc/locale/ja/LC_MESSAGES/reference.po Modified: doc/locale/ja/LC_MESSAGES/reference.po (+305 -107) =================================================================== --- doc/locale/ja/LC_MESSAGES/reference.po 2018-12-28 12:13:43 +0900 (b80868027) +++ doc/locale/ja/LC_MESSAGES/reference.po 2018-12-28 12:14:44 +0900 (324dca587) @@ -26638,12 +26638,113 @@ msgstr "利用可能なトークンフィルター" msgid "Here is the list of available token filters:" msgstr "以下は組み込みのトークンフィルターのリストです。" -msgid "``TokenFilterStopWord``" +msgid "``TokenFilterNFKC100``" +msgstr "" + +msgid "" +"This token filter can translate a token for katakana to hiragana with same " +"option of NormalizerNFKC100. This token filter convenient when you want to " +"get reading of token as hiragana." +msgstr "" +"このトークンフィルターは、 ``NormalizerNFKC100`` と同じオプションでカタカナの" +"トークンをひらがなに変換できます。このトークンフィルターは、トークンの読みが" +"なをひらがなとして取得したい時に便利です。" + +msgid "``TokenFilterNFKC100`` has a parameter::" +msgstr "``TokenFilterNFKC100`` は引数が一つあります。" + +msgid "" +"Here is an example of ``TokenFilterNFKC100``. ``リンゴ`` is translated to ``" +"りんご``." msgstr "" +"以下は、 ``TokenFilterNFKC100`` の例です。 ``リンゴ`` を ``りんご`` へ変換し" +"ています。" + +msgid "" +"``TokenFilterNFKC100`` is not translate a token of hiragana and kanji as " +"below." +msgstr "" +"以下のように、 ``TokenFilterNFKC100`` はひらがなと漢字のトークンは変換しませ" +"ん。" + +msgid "Advanced usage" +msgstr "高度な使い方" + +msgid "" +"You can output all input string as hiragana with cimbining " +"``TokenFilterNFKC100`` with ``use_reading`` option of ``TokenMecab`` as " +"below." +msgstr "" +"``TokenFilterNFKC100`` と ``TokenMecab`` の ``use_reading`` オプションを組み" +"合わせることで、入力文字列を全てひらがなとして出力できます。" + +msgid "There are a required parameters ``unify_kana``." +msgstr "必須の引数 ``unify_kana`` があります。" + +msgid "``unify_kana``" +msgstr "" + +msgid "Translate a token katakana to hiragana." +msgstr "カタカナのトークンをひらがなに変換します。" msgid "``TokenFilterStem``" msgstr "" +msgid "``TokenFilterStem`` stems tokenized token." +msgstr "``TokenFilterStem`` は、トークナイズされたトークンをステミングします。" + +msgid "``TokenFilterStopWord`` has optional parameter::" +msgstr "``TokenFilterStopWord`` は、省略可能な引数があります。" + +msgid "Here is an example that uses ``TokenFilterStem`` token filter:" +msgstr "以下は ``TokenFilterStem`` トークンフィルターを使う例です。" + +msgid "" +"All of ``develop``, ``developing``, ``developed`` and ``develops`` tokens " +"are stemmed as ``develop``. So we can find ``develop``, ``developing`` and " +"``developed`` by ``develops`` query." +msgstr "" +"``develop`` も ``developing`` も ``developed`` も ``develops`` も、すべてステ" +"ミングすると ``develop`` になります。そのため、 ``develops`` というクエリー" +"で ``develop`` も ``developing`` も ``developed`` も検索できます。" + +msgid "" +"You can specify steming algorithm except English with ``algorithm`` option " +"as below." +msgstr "" +"以下のように ``algorithm`` オプションを使って、英語以外のステミングアルゴリズ" +"ムを指定できます。" + +msgid "There is a optional parameters ``algorithm``." +msgstr "省略可能な引数として ``algorithm`` があります。" + +msgid "``algorithm``" +msgstr "" + +msgid "Specify a steming algorithm." +msgstr "ステミングアルゴリズムを指定します。" + +msgid "" +"Steming algorithm is extract the stem. It is prepared for each language." +msgstr "" +"ステミングアルゴリズムとは、語幹を抽出するもので、各言語用に用意されていま" +"す。" + +msgid "" +"You can extract the stem of each language by changing steming algorithm. For " +"example, if you want extract the stem of the French, you specify French to " +"``algorithm`` option." +msgstr "" +"ステミングアルゴリズムを切り替えることに寄って、各言語の語幹を抽出できます。" +"例えば、フランス語の語幹を抽出したい場合は、 ``algorithm`` オプションに " +"French を指定します。" + +msgid "Here are support steming algorithm::" +msgstr "サポートしているステミングアルゴリズムは以下の通りです::" + +msgid "``TokenFilterStopWord``" +msgstr "" + msgid "" "``TokenFilterStopWord`` removes stop words from tokenized token in searching " "the documents." @@ -26658,8 +26759,12 @@ msgstr "" "``TokenFilterStopWord`` は、文書を検索する時のみトークン除去するため、文書を" "追加した後でストップワードを指定することもできます。" -msgid "The stop word is specified ``is_stop_word`` column on lexicon table." -msgstr "ストップワードは、語彙表の ``is_stop_word`` カラムで指定します。" +msgid "" +"The stop word is specified ``is_stop_word`` column on lexicon table when you " +"don't specify ``column`` option." +msgstr "" +"``column`` オプションを指定しない場合、ストップワードは、語彙表の " +"``is_stop_word`` カラムで指定されます。" msgid "Here is an example that uses ``TokenFilterStopWord`` token filter:" msgstr "以下は ``TokenFilterStopWord`` トークンフィルターを使う例です。" @@ -26677,20 +26782,18 @@ msgstr "" "``and`` はストップワードと指定されているため、クエリーから除去されているから" "です。" -msgid "``TokenFilterStem`` stems tokenized token." -msgstr "``TokenFilterStem`` は、トークナイズされたトークンをステミングします。" - -msgid "Here is an example that uses ``TokenFilterStem`` token filter:" -msgstr "以下は ``TokenFilterStem`` トークンフィルターを使う例です。" - msgid "" -"All of ``develop``, ``developing``, ``developed`` and ``develops`` tokens " -"are stemmed as ``develop``. So we can find ``develop``, ``developing`` and " -"``developed`` by ``develops`` query." +"You can specify stop word in column except ``is_stop_columns`` by " +"``columns`` option as below." msgstr "" -"``develop`` も ``developing`` も ``developed`` も ``develops`` も、すべてステ" -"ミングすると ``develop`` になります。そのため、 ``develops`` というクエリー" -"で ``develop`` も ``developing`` も ``developed`` も検索できます。" +"以下のように ``columns`` オプションを使って ``is_stop_columns`` 以外のカラム" +"をストップワードに指定できます。" + +msgid "There is a optional parameters ``columns``." +msgstr "省略可能な引数 ``columns`` があります。" + +msgid "Specify a column that specified a stop word." +msgstr "ストップワードを指定するカラムを指定します。" msgid "Tokenizers" msgstr "トークナイザー" @@ -27254,92 +27357,6 @@ msgstr "``TokenDelimitNull`` もタグテキストに適切です。" msgid "Here is an example of ``TokenDelimitNull``:" msgstr "以下は ``TokenDelimitNull`` の例です。" -msgid "" -"``TokenMecab`` is a tokenizer based on `MeCab <https://taku910.github.io/" -"mecab/>`_ part-of-speech and morphological analyzer." -msgstr "" -"``TokenMecab`` は `MeCab <https://taku910.github.io/mecab/>`_ 形態素解析器を" -"ベースにしたトークナイザーです。" - -msgid "" -"MeCab doesn't depend on Japanese. You can use MeCab for other languages by " -"creating dictionary for the languages. You can use `NAIST Japanese " -"Dictionary <http://osdn.jp/projects/naist-jdic/>`_ for Japanese." -msgstr "" -"MeCabは日本語に依存していません。その言語用の辞書を用意すれば日本語以外でも" -"MeCabを使えます。日本語用の辞書には `NAIST Japanese Dictionary <http://" -"sourceforge.jp/projects/naist-jdic/>`_ を使えます。" - -msgid "" -"You need to install an additional package to using TokenMecab. For more " -"detail of how to installing an additional package, see `how to install each " -"OS <http://groonga.org/docs/install.html>`_ ." -msgstr "" -"``TokenMecab`` を使うには、追加のパッケージをインストールする必要があります。" -"追加のパッケージをインストールする方法の詳細については、`各OSのインストール方" -"法 <http://groonga.org/ja/docs/install.html>`_ を参照して下さい。" - -msgid "" -"``TokenMecab`` is good for precision rather than recall. You can find ``東京" -"都`` and ``京都`` texts by ``京都`` query with :ref:`token-bigram` but ``東京" -"都`` isn't expected. You can find only ``京都`` text by ``京都`` query with " -"``TokenMecab``." -msgstr "" -"``TokenMecab`` は再現率より適合率に優れています。 :ref:`token-bigram` では ``" -"京都`` というクエリーで ``東京都`` も ``京都`` も見つかりますが、この場合は " -"``東京都`` は期待した結果ではありません。 ``TokenMecab`` を使うと ``京都`` と" -"いうクエリーで ``京都`` だけを見つけられます。" - -msgid "" -"If you want to support neologisms, you need to keep updating your MeCab " -"dictionary. It needs maintain cost. (:ref:`token-bigram` doesn't require " -"dictionary maintenance because :ref:`token-bigram` doesn't use dictionary.) " -"`mecab-ipadic-NEologd : Neologism dictionary for MeCab <https://github.com/" -"neologd/mecab-ipadic-neologd>`_ may help you." -msgstr "" -"新語をサポートしたい場合は、MeCabの辞書を更新し続ける必要があります。これはメ" -"ンテナンスコストがかかります。( :ref:`token-bigram` には辞書のメンテナンスコ" -"ストはありません。なぜなら、 :ref:`token-bigram` は辞書を使っていないからで" -"す。)新語への対応に `mecab-ipadic-NEologd : Neologism dictionary for MeCab " -"<https://github.com/neologd/mecab-ipadic-neologd>`_ が役に立つかもしれませ" -"ん。" - -msgid "" -"Here is an example of ``TokenMeCab``. ``東京都`` is tokenized to ``東京`` " -"and ``都``. They don't include ``京都``:" -msgstr "" -"以下は ``TokenMeCab`` の例です。 ``東京都`` は ``東京`` と ``都`` にトークナ" -"イズされています。 ``京都`` というトークンはありません。" - -msgid "" -"``TokenMecab`` can also specify options. ``TokenMecab`` has ``target_class`` " -"option, ``include_class`` option, ``include_reading`` option, " -"``include_form`` option and ``use_reading``." -msgstr "" -"``TokenMecab`` はオプションを指定することもできます。``TokenMecab`` は、" -"``target_class`` オプション、 ``include_class`` オプション、 " -"``include_reading`` オプション、 ``include_form`` オプションと " -"``use_reading`` オプションがあります。" - -msgid "" -"``target_class`` option searches a token of specifying a part-of-speech. For " -"example, you can search only a noun as below." -msgstr "" -"``target_class`` オプションは、指定した品詞のトークンを検索します。例えば、以" -"下のように名詞のみを検索できます。" - -msgid "" -"``target_class`` option can also specify subclasses and exclude or add " -"specific part-of-speech of specific using + or -. So, you can also search a " -"noun with excluding non-independent word and suffix of person name as below." -msgstr "" -"``target_class`` オプションは、サブクラスを指定することや、 + や - を使って、" -"特定の品詞を追加または、除外することもできます。したがって、以下のように人名" -"の接尾語と非自立語を除いた名詞を検索することもできます。" - -msgid "In this way you can search exclude the noise of token." -msgstr "このようにして、ノイズとなるトークンを除外して検索できます。" - msgid "This tokenizer is experimental. Specification may be changed." msgstr "このトークナイザーは実験的です。仕様が変わる可能性があります。" @@ -27409,6 +27426,24 @@ msgstr "" msgid "``TokenDelimit`` has optional parameter::" msgstr "``TokenDelimit`` は、省略可能な引数があります。" +msgid "" +"No options(Extracts token by splitting one or more space characters (``U" +"+0020``))::" +msgstr "" +"オプションなし(1つ以上の空白文字( ``U+0020`` )で分割してトークンを抽出)::" + +msgid "Specify delimiter::" +msgstr "区切り文字を指定::" + +msgid "Specify delimiter with regular expression::" +msgstr "正規表現で区切り文字を指定::" + +msgid "" +"The ``delimiter`` option and a ``pattern`` option are not use at the same " +"time." +msgstr "" +"``delimiter`` オプションと ``pattern`` オプションは同時に使用できません。" + msgid "Here is an example of ``TokenDelimit``:" msgstr "以下は ``TokenDelimit`` の例です。" @@ -27457,9 +27492,6 @@ msgstr "" "以下の例の用に ``pattern`` オプションを使うことで、その不要な空白を除去できま" "す。" -msgid "Advanced usage" -msgstr "高度な使い方" - msgid "``delimiter`` option can also specify multiple delimiters." msgstr "``delimiter`` オプションは、複数の区切り文字を指定することもできます。" @@ -27538,15 +27570,18 @@ msgstr "" "``!``、 ``?`` の後ろに ``)`` または ``」`` がある場合は、 ``。`` や ``!" "``、 ``?`` は区切り文字としません。" -msgid "There are two optional parameters ``delimiters`` and ``parameters``." -msgstr "省略可能引数は2つあります。 ``delimiters`` と ``parameters`` です。" +msgid "There are two optional parameters ``delimiter`` and ``pattern``." +msgstr "省略可能引数は2つあります。 ``delimiter`` と ``pattern`` です。" -msgid "``delimiters``" +msgid "``delimiter``" msgstr "" msgid "Split token with a specified character." msgstr "指定した文字でトークンを分割します。" +msgid "You can use one or more characters for a delimiter." +msgstr "区切り文字には、1つ以上の文字を指定できます。" + msgid "``pattern``" msgstr "" @@ -27556,6 +27591,169 @@ msgstr "正規表現を使って、トークンを分割します。" msgid ":doc:`../commands/tokenize`" msgstr "" +msgid "" +"``TokenMecab`` is a tokenizer based on `MeCab <https://taku910.github.io/" +"mecab/>`_ part-of-speech and morphological analyzer." +msgstr "" +"``TokenMecab`` は `MeCab <https://taku910.github.io/mecab/>`_ 形態素解析器を" +"ベースにしたトークナイザーです。" + +msgid "" +"MeCab doesn't depend on Japanese. You can use MeCab for other languages by " +"creating dictionary for the languages. You can use `NAIST Japanese " +"Dictionary <http://osdn.jp/projects/naist-jdic/>`_ for Japanese." +msgstr "" +"MeCabは日本語に依存していません。その言語用の辞書を用意すれば日本語以外でも" +"MeCabを使えます。日本語用の辞書には `NAIST Japanese Dictionary <http://" +"sourceforge.jp/projects/naist-jdic/>`_ を使えます。" + +msgid "" +"You need to install an additional package to using TokenMecab. For more " +"detail of how to installing an additional package, see `how to install each " +"OS <http://groonga.org/docs/install.html>`_ ." +msgstr "" +"``TokenMecab`` を使うには、追加のパッケージをインストールする必要があります。" +"追加のパッケージをインストールする方法の詳細については、`各OSのインストール方" +"法 <http://groonga.org/ja/docs/install.html>`_ を参照して下さい。" + +msgid "" +"``TokenMecab`` is good for precision rather than recall. You can find ``東京" +"都`` and ``京都`` texts by ``京都`` query with :ref:`token-bigram` but ``東京" +"都`` isn't expected. You can find only ``京都`` text by ``京都`` query with " +"``TokenMecab``." +msgstr "" +"``TokenMecab`` は再現率より適合率に優れています。 :ref:`token-bigram` では ``" +"京都`` というクエリーで ``東京都`` も ``京都`` も見つかりますが、この場合は " +"``東京都`` は期待した結果ではありません。 ``TokenMecab`` を使うと ``京都`` と" +"いうクエリーで ``京都`` だけを見つけられます。" + +msgid "" +"If you want to support neologisms, you need to keep updating your MeCab " +"dictionary. It needs maintain cost. (:ref:`token-bigram` doesn't require " +"dictionary maintenance because :ref:`token-bigram` doesn't use dictionary.) " +"`mecab-ipadic-NEologd : Neologism dictionary for MeCab <https://github.com/" +"neologd/mecab-ipadic-neologd>`_ may help you." +msgstr "" +"新語をサポートしたい場合は、MeCabの辞書を更新し続ける必要があります。これはメ" +"ンテナンスコストがかかります。( :ref:`token-bigram` には辞書のメンテナンスコ" +"ストはありません。なぜなら、 :ref:`token-bigram` は辞書を使っていないからで" +"す。)新語への対応に `mecab-ipadic-NEologd : Neologism dictionary for MeCab " +"<https://github.com/neologd/mecab-ipadic-neologd>`_ が役に立つかもしれませ" +"ん。" + +msgid "``TokenMecab`` has optional parameter::" +msgstr "``TokenMecab`` は、省略可能な引数があります。" + +msgid "" +"Here is an example of ``TokenMeCab``. ``東京都`` is tokenized to ``東京`` " +"and ``都``. They don't include ``京都``:" +msgstr "" +"以下は ``TokenMeCab`` の例です。 ``東京都`` は ``東京`` と ``都`` にトークナ" +"イズされています。 ``京都`` というトークンはありません。" + +msgid "" +"``TokenMecab`` can also specify options. ``TokenMecab`` has ``target_class`` " +"option, ``include_class`` option, ``include_reading`` option, " +"``include_form`` option and ``use_reading`` option." +msgstr "" +"``TokenMecab`` はオプションを指定することもできます。``TokenMecab`` は、" +"``target_class`` オプション、 ``include_class`` オプション、 " +"``include_reading`` オプション、 ``include_form`` オプションと " +"``use_reading`` オプションがあります。" + +msgid "" +"``target_class`` option searches a token of specifying a part-of-speech. For " +"example, you can search only a noun as below." +msgstr "" +"``target_class`` オプションは、指定した品詞のトークンを検索します。例えば、以" +"下のように名詞のみを検索できます。" + +msgid "" +"``include_class`` option outputs class and subclass in Mecab’s metadata as " +"below." +msgstr "" +"``include_class`` オプションは、以下のようにMecabのメタデータのclassと" +"subclassを出力します。" + +msgid "" +"You can exclude needless token with ``target_class`` and class and sub class " +"of this option outputs." +msgstr "" +"このオプションで出力するclassとsubclassと ``target_class`` で不要なトークンを" +"取り除くことができます。" + +msgid "``include_reading`` outputs reading in Mecab’s metadata as below." +msgstr "" +"``include_reading`` は以下のように、Mecabのメタデータのreadingを出力します。" + +msgid "You can get reading of a token with this option." +msgstr "このオプションを使って、トークンの読みを取得できます。" + +msgid "" +"``include_form`` outputs inflected_type, inflected_form and base_form in " +"Mecab’s metadata as below." +msgstr "" +"``include_form`` は、以下のようにMecabのメタデータのinflected_typeと" +"include_formを出力します。" + +msgid "" +"``use_reading`` supports a search by kana. This option is useful for " +"countermeasure of orthographical variants because it searches with kana." +msgstr "" +"``use_reading`` は、読みがなによる検索をサポートします。このオプションは、読" +"みがなを使った検索をするため、表記ゆれの対策として有用です。" + +msgid "" +"``target_class`` option can also specify subclasses and exclude or add " +"specific part-of-speech of specific using + or -. So, you can also search a " +"noun with excluding non-independent word and suffix of person name as below." +msgstr "" +"``target_class`` オプションは、サブクラスを指定することや、 + や - を使って、" +"特定の品詞を追加または、除外することもできます。したがって、以下のように人名" +"の接尾語と非自立語を除いた名詞を検索することもできます。" + +msgid "In this way you can search exclude the noise of token." +msgstr "このようにして、ノイズとなるトークンを除外して検索できます。" + +msgid "" +"In addition, you can get reading of a token that exclude the noise with " +"``include_reading`` option as below." +msgstr "" +"加えて、以下のように ``include_reading`` を使って、ノイズを除去したトークンの" +"読みがなを取得できます。" + +msgid "" +"There are four optional parameters ``include_class`` , ``target_class`` , " +"``include_form`` and ``use_reading`` ." +msgstr "" +"省略可能引数は4つあります。 ``include_class`` 、 ``target_class`` 、 " +"``include_form`` と ``use_reading`` です。" + +msgid "``include_class``" +msgstr "" + +msgid "Outputs class and subclass in Mecab’s metadata." +msgstr "Mecabのメタデータのclassとsubclassを出力します。" + +msgid "``target_class``" +msgstr "" + +msgid "Outputs a token of specifying a part-of-speech." +msgstr "指定した品詞のトークンを出力します。" + +msgid "``include_form``" +msgstr "" + +msgid "" +"Outputs inflected_type, inflected_form and base_form in Mecab’s metadata." +msgstr "Mecabのメタデータのinflected_typeとinflected_formを出力します。" + +msgid "``use_reading``" +msgstr "" + +msgid "Outputs reading of token." +msgstr "トークンの読みがなを出力します。" + msgid "Tuning" msgstr "チューニング" -------------- next part -------------- An HTML attachment was scrubbed... URL: <https://lists.osdn.me/mailman/archives/groonga-commit/attachments/20181228/5bd42531/attachment-0001.html>