[Groonga-commit] groonga/groonga at 564d25a [master] doc ja: translate about tokenizers and tokenfilters

Back to archive index
Yasuhiro Horimoto null+****@clear*****
Fri Dec 28 12:14:44 JST 2018


Yasuhiro Horimoto	2018-12-28 12:14:44 +0900 (Fri, 28 Dec 2018)

  Revision: 564d25a3191d468fcddbdef3dd2c8e1902de14eb
  https://github.com/groonga/groonga/commit/564d25a3191d468fcddbdef3dd2c8e1902de14eb

  Message:
    doc ja: translate about tokenizers and tokenfilters

  Modified files:
    doc/locale/ja/LC_MESSAGES/reference.po

  Modified: doc/locale/ja/LC_MESSAGES/reference.po (+305 -107)
===================================================================
--- doc/locale/ja/LC_MESSAGES/reference.po    2018-12-28 12:13:43 +0900 (b80868027)
+++ doc/locale/ja/LC_MESSAGES/reference.po    2018-12-28 12:14:44 +0900 (324dca587)
@@ -26638,12 +26638,113 @@ msgstr "利用可能なトークンフィルター"
 msgid "Here is the list of available token filters:"
 msgstr "以下は組み込みのトークンフィルターのリストです。"
 
-msgid "``TokenFilterStopWord``"
+msgid "``TokenFilterNFKC100``"
+msgstr ""
+
+msgid ""
+"This token filter can translate a token for katakana to hiragana with same "
+"option of NormalizerNFKC100. This token filter convenient when you want to "
+"get reading of token as hiragana."
+msgstr ""
+"このトークンフィルターは、 ``NormalizerNFKC100`` と同じオプションでカタカナの"
+"トークンをひらがなに変換できます。このトークンフィルターは、トークンの読みが"
+"なをひらがなとして取得したい時に便利です。"
+
+msgid "``TokenFilterNFKC100`` has a parameter::"
+msgstr "``TokenFilterNFKC100`` は引数が一つあります。"
+
+msgid ""
+"Here is an example of ``TokenFilterNFKC100``. ``リンゴ`` is translated to ``"
+"りんご``."
 msgstr ""
+"以下は、 ``TokenFilterNFKC100`` の例です。 ``リンゴ`` を ``りんご`` へ変換し"
+"ています。"
+
+msgid ""
+"``TokenFilterNFKC100`` is not translate a token of hiragana and kanji as "
+"below."
+msgstr ""
+"以下のように、 ``TokenFilterNFKC100`` はひらがなと漢字のトークンは変換しませ"
+"ん。"
+
+msgid "Advanced usage"
+msgstr "高度な使い方"
+
+msgid ""
+"You can output all input string as hiragana with cimbining "
+"``TokenFilterNFKC100`` with ``use_reading`` option of ``TokenMecab`` as "
+"below."
+msgstr ""
+"``TokenFilterNFKC100`` と ``TokenMecab`` の ``use_reading`` オプションを組み"
+"合わせることで、入力文字列を全てひらがなとして出力できます。"
+
+msgid "There are a required parameters ``unify_kana``."
+msgstr "必須の引数 ``unify_kana`` があります。"
+
+msgid "``unify_kana``"
+msgstr ""
+
+msgid "Translate a token katakana to hiragana."
+msgstr "カタカナのトークンをひらがなに変換します。"
 
 msgid "``TokenFilterStem``"
 msgstr ""
 
+msgid "``TokenFilterStem`` stems tokenized token."
+msgstr "``TokenFilterStem`` は、トークナイズされたトークンをステミングします。"
+
+msgid "``TokenFilterStopWord`` has optional parameter::"
+msgstr "``TokenFilterStopWord`` は、省略可能な引数があります。"
+
+msgid "Here is an example that uses ``TokenFilterStem`` token filter:"
+msgstr "以下は ``TokenFilterStem`` トークンフィルターを使う例です。"
+
+msgid ""
+"All of ``develop``, ``developing``, ``developed`` and ``develops`` tokens "
+"are stemmed as ``develop``. So we can find ``develop``, ``developing`` and "
+"``developed`` by ``develops`` query."
+msgstr ""
+"``develop`` も ``developing`` も ``developed`` も ``develops`` も、すべてステ"
+"ミングすると ``develop`` になります。そのため、 ``develops`` というクエリー"
+"で ``develop`` も ``developing`` も ``developed`` も検索できます。"
+
+msgid ""
+"You can specify steming algorithm except English with ``algorithm`` option "
+"as below."
+msgstr ""
+"以下のように ``algorithm`` オプションを使って、英語以外のステミングアルゴリズ"
+"ムを指定できます。"
+
+msgid "There is a optional parameters ``algorithm``."
+msgstr "省略可能な引数として ``algorithm`` があります。"
+
+msgid "``algorithm``"
+msgstr ""
+
+msgid "Specify a steming algorithm."
+msgstr "ステミングアルゴリズムを指定します。"
+
+msgid ""
+"Steming algorithm is extract the stem. It is prepared for each language."
+msgstr ""
+"ステミングアルゴリズムとは、語幹を抽出するもので、各言語用に用意されていま"
+"す。"
+
+msgid ""
+"You can extract the stem of each language by changing steming algorithm. For "
+"example, if you want extract the stem of the French, you specify French to "
+"``algorithm`` option."
+msgstr ""
+"ステミングアルゴリズムを切り替えることに寄って、各言語の語幹を抽出できます。"
+"例えば、フランス語の語幹を抽出したい場合は、 ``algorithm`` オプションに "
+"French を指定します。"
+
+msgid "Here are support steming algorithm::"
+msgstr "サポートしているステミングアルゴリズムは以下の通りです::"
+
+msgid "``TokenFilterStopWord``"
+msgstr ""
+
 msgid ""
 "``TokenFilterStopWord`` removes stop words from tokenized token in searching "
 "the documents."
@@ -26658,8 +26759,12 @@ msgstr ""
 "``TokenFilterStopWord`` は、文書を検索する時のみトークン除去するため、文書を"
 "追加した後でストップワードを指定することもできます。"
 
-msgid "The stop word is specified ``is_stop_word`` column on lexicon table."
-msgstr "ストップワードは、語彙表の ``is_stop_word`` カラムで指定します。"
+msgid ""
+"The stop word is specified ``is_stop_word`` column on lexicon table when you "
+"don't specify ``column`` option."
+msgstr ""
+"``column`` オプションを指定しない場合、ストップワードは、語彙表の "
+"``is_stop_word`` カラムで指定されます。"
 
 msgid "Here is an example that uses ``TokenFilterStopWord`` token filter:"
 msgstr "以下は ``TokenFilterStopWord`` トークンフィルターを使う例です。"
@@ -26677,20 +26782,18 @@ msgstr ""
 "``and`` はストップワードと指定されているため、クエリーから除去されているから"
 "です。"
 
-msgid "``TokenFilterStem`` stems tokenized token."
-msgstr "``TokenFilterStem`` は、トークナイズされたトークンをステミングします。"
-
-msgid "Here is an example that uses ``TokenFilterStem`` token filter:"
-msgstr "以下は ``TokenFilterStem`` トークンフィルターを使う例です。"
-
 msgid ""
-"All of ``develop``, ``developing``, ``developed`` and ``develops`` tokens "
-"are stemmed as ``develop``. So we can find ``develop``, ``developing`` and "
-"``developed`` by ``develops`` query."
+"You can specify stop word in column except ``is_stop_columns`` by "
+"``columns`` option as below."
 msgstr ""
-"``develop`` も ``developing`` も ``developed`` も ``develops`` も、すべてステ"
-"ミングすると ``develop`` になります。そのため、 ``develops`` というクエリー"
-"で ``develop`` も ``developing`` も ``developed`` も検索できます。"
+"以下のように ``columns`` オプションを使って ``is_stop_columns`` 以外のカラム"
+"をストップワードに指定できます。"
+
+msgid "There is a optional parameters ``columns``."
+msgstr "省略可能な引数 ``columns`` があります。"
+
+msgid "Specify a column that specified a stop word."
+msgstr "ストップワードを指定するカラムを指定します。"
 
 msgid "Tokenizers"
 msgstr "トークナイザー"
@@ -27254,92 +27357,6 @@ msgstr "``TokenDelimitNull`` もタグテキストに適切です。"
 msgid "Here is an example of ``TokenDelimitNull``:"
 msgstr "以下は ``TokenDelimitNull`` の例です。"
 
-msgid ""
-"``TokenMecab`` is a tokenizer based on `MeCab <https://taku910.github.io/"
-"mecab/>`_ part-of-speech and morphological analyzer."
-msgstr ""
-"``TokenMecab`` は `MeCab <https://taku910.github.io/mecab/>`_ 形態素解析器を"
-"ベースにしたトークナイザーです。"
-
-msgid ""
-"MeCab doesn't depend on Japanese. You can use MeCab for other languages by "
-"creating dictionary for the languages. You can use `NAIST Japanese "
-"Dictionary <http://osdn.jp/projects/naist-jdic/>`_ for Japanese."
-msgstr ""
-"MeCabは日本語に依存していません。その言語用の辞書を用意すれば日本語以外でも"
-"MeCabを使えます。日本語用の辞書には `NAIST Japanese Dictionary <http://"
-"sourceforge.jp/projects/naist-jdic/>`_ を使えます。"
-
-msgid ""
-"You need to install an additional package to using TokenMecab. For more "
-"detail of how to installing an additional package, see `how to install each "
-"OS <http://groonga.org/docs/install.html>`_ ."
-msgstr ""
-"``TokenMecab`` を使うには、追加のパッケージをインストールする必要があります。"
-"追加のパッケージをインストールする方法の詳細については、`各OSのインストール方"
-"法 <http://groonga.org/ja/docs/install.html>`_ を参照して下さい。"
-
-msgid ""
-"``TokenMecab`` is good for precision rather than recall. You can find ``東京"
-"都`` and ``京都`` texts by ``京都`` query with :ref:`token-bigram` but ``東京"
-"都`` isn't expected. You can find only ``京都`` text by ``京都`` query with "
-"``TokenMecab``."
-msgstr ""
-"``TokenMecab`` は再現率より適合率に優れています。 :ref:`token-bigram` では ``"
-"京都`` というクエリーで ``東京都`` も ``京都`` も見つかりますが、この場合は "
-"``東京都`` は期待した結果ではありません。 ``TokenMecab`` を使うと ``京都`` と"
-"いうクエリーで ``京都`` だけを見つけられます。"
-
-msgid ""
-"If you want to support neologisms, you need to keep updating your MeCab "
-"dictionary. It needs maintain cost. (:ref:`token-bigram` doesn't require "
-"dictionary maintenance because :ref:`token-bigram` doesn't use dictionary.) "
-"`mecab-ipadic-NEologd : Neologism dictionary for MeCab <https://github.com/"
-"neologd/mecab-ipadic-neologd>`_ may help you."
-msgstr ""
-"新語をサポートしたい場合は、MeCabの辞書を更新し続ける必要があります。これはメ"
-"ンテナンスコストがかかります。( :ref:`token-bigram` には辞書のメンテナンスコ"
-"ストはありません。なぜなら、 :ref:`token-bigram` は辞書を使っていないからで"
-"す。)新語への対応に `mecab-ipadic-NEologd : Neologism dictionary for MeCab "
-"<https://github.com/neologd/mecab-ipadic-neologd>`_ が役に立つかもしれませ"
-"ん。"
-
-msgid ""
-"Here is an example of ``TokenMeCab``. ``東京都`` is tokenized to ``東京`` "
-"and ``都``. They don't include ``京都``:"
-msgstr ""
-"以下は ``TokenMeCab`` の例です。 ``東京都`` は ``東京`` と ``都`` にトークナ"
-"イズされています。 ``京都`` というトークンはありません。"
-
-msgid ""
-"``TokenMecab`` can also specify options. ``TokenMecab`` has ``target_class`` "
-"option, ``include_class`` option, ``include_reading`` option, "
-"``include_form`` option and ``use_reading``."
-msgstr ""
-"``TokenMecab`` はオプションを指定することもできます。``TokenMecab`` は、"
-"``target_class`` オプション、 ``include_class`` オプション、 "
-"``include_reading`` オプション、 ``include_form`` オプションと "
-"``use_reading`` オプションがあります。"
-
-msgid ""
-"``target_class`` option searches a token of specifying a part-of-speech. For "
-"example, you can search only a noun as below."
-msgstr ""
-"``target_class`` オプションは、指定した品詞のトークンを検索します。例えば、以"
-"下のように名詞のみを検索できます。"
-
-msgid ""
-"``target_class`` option can also specify subclasses and exclude or add "
-"specific part-of-speech of specific using + or -. So, you can also search a "
-"noun with excluding non-independent word and suffix of person name as below."
-msgstr ""
-"``target_class`` オプションは、サブクラスを指定することや、 + や - を使って、"
-"特定の品詞を追加または、除外することもできます。したがって、以下のように人名"
-"の接尾語と非自立語を除いた名詞を検索することもできます。"
-
-msgid "In this way you can search exclude the noise of token."
-msgstr "このようにして、ノイズとなるトークンを除外して検索できます。"
-
 msgid "This tokenizer is experimental. Specification may be changed."
 msgstr "このトークナイザーは実験的です。仕様が変わる可能性があります。"
 
@@ -27409,6 +27426,24 @@ msgstr ""
 msgid "``TokenDelimit`` has optional parameter::"
 msgstr "``TokenDelimit`` は、省略可能な引数があります。"
 
+msgid ""
+"No options(Extracts token by splitting one or more space characters (``U"
+"+0020``))::"
+msgstr ""
+"オプションなし(1つ以上の空白文字( ``U+0020`` )で分割してトークンを抽出)::"
+
+msgid "Specify delimiter::"
+msgstr "区切り文字を指定::"
+
+msgid "Specify delimiter with regular expression::"
+msgstr "正規表現で区切り文字を指定::"
+
+msgid ""
+"The ``delimiter`` option and a ``pattern`` option are not use at the same "
+"time."
+msgstr ""
+"``delimiter`` オプションと ``pattern`` オプションは同時に使用できません。"
+
 msgid "Here is an example of ``TokenDelimit``:"
 msgstr "以下は ``TokenDelimit`` の例です。"
 
@@ -27457,9 +27492,6 @@ msgstr ""
 "以下の例の用に ``pattern`` オプションを使うことで、その不要な空白を除去できま"
 "す。"
 
-msgid "Advanced usage"
-msgstr "高度な使い方"
-
 msgid "``delimiter`` option can also specify multiple delimiters."
 msgstr "``delimiter`` オプションは、複数の区切り文字を指定することもできます。"
 
@@ -27538,15 +27570,18 @@ msgstr ""
 "``!``、 ``?`` の後ろに ``)`` または ``」`` がある場合は、 ``。`` や ``!"
 "``、 ``?`` は区切り文字としません。"
 
-msgid "There are two optional parameters ``delimiters`` and ``parameters``."
-msgstr "省略可能引数は2つあります。 ``delimiters`` と ``parameters`` です。"
+msgid "There are two optional parameters ``delimiter`` and ``pattern``."
+msgstr "省略可能引数は2つあります。 ``delimiter`` と ``pattern`` です。"
 
-msgid "``delimiters``"
+msgid "``delimiter``"
 msgstr ""
 
 msgid "Split token with a specified character."
 msgstr "指定した文字でトークンを分割します。"
 
+msgid "You can use one or more characters for a delimiter."
+msgstr "区切り文字には、1つ以上の文字を指定できます。"
+
 msgid "``pattern``"
 msgstr ""
 
@@ -27556,6 +27591,169 @@ msgstr "正規表現を使って、トークンを分割します。"
 msgid ":doc:`../commands/tokenize`"
 msgstr ""
 
+msgid ""
+"``TokenMecab`` is a tokenizer based on `MeCab <https://taku910.github.io/"
+"mecab/>`_ part-of-speech and morphological analyzer."
+msgstr ""
+"``TokenMecab`` は `MeCab <https://taku910.github.io/mecab/>`_ 形態素解析器を"
+"ベースにしたトークナイザーです。"
+
+msgid ""
+"MeCab doesn't depend on Japanese. You can use MeCab for other languages by "
+"creating dictionary for the languages. You can use `NAIST Japanese "
+"Dictionary <http://osdn.jp/projects/naist-jdic/>`_ for Japanese."
+msgstr ""
+"MeCabは日本語に依存していません。その言語用の辞書を用意すれば日本語以外でも"
+"MeCabを使えます。日本語用の辞書には `NAIST Japanese Dictionary <http://"
+"sourceforge.jp/projects/naist-jdic/>`_ を使えます。"
+
+msgid ""
+"You need to install an additional package to using TokenMecab. For more "
+"detail of how to installing an additional package, see `how to install each "
+"OS <http://groonga.org/docs/install.html>`_ ."
+msgstr ""
+"``TokenMecab`` を使うには、追加のパッケージをインストールする必要があります。"
+"追加のパッケージをインストールする方法の詳細については、`各OSのインストール方"
+"法 <http://groonga.org/ja/docs/install.html>`_ を参照して下さい。"
+
+msgid ""
+"``TokenMecab`` is good for precision rather than recall. You can find ``東京"
+"都`` and ``京都`` texts by ``京都`` query with :ref:`token-bigram` but ``東京"
+"都`` isn't expected. You can find only ``京都`` text by ``京都`` query with "
+"``TokenMecab``."
+msgstr ""
+"``TokenMecab`` は再現率より適合率に優れています。 :ref:`token-bigram` では ``"
+"京都`` というクエリーで ``東京都`` も ``京都`` も見つかりますが、この場合は "
+"``東京都`` は期待した結果ではありません。 ``TokenMecab`` を使うと ``京都`` と"
+"いうクエリーで ``京都`` だけを見つけられます。"
+
+msgid ""
+"If you want to support neologisms, you need to keep updating your MeCab "
+"dictionary. It needs maintain cost. (:ref:`token-bigram` doesn't require "
+"dictionary maintenance because :ref:`token-bigram` doesn't use dictionary.) "
+"`mecab-ipadic-NEologd : Neologism dictionary for MeCab <https://github.com/"
+"neologd/mecab-ipadic-neologd>`_ may help you."
+msgstr ""
+"新語をサポートしたい場合は、MeCabの辞書を更新し続ける必要があります。これはメ"
+"ンテナンスコストがかかります。( :ref:`token-bigram` には辞書のメンテナンスコ"
+"ストはありません。なぜなら、 :ref:`token-bigram` は辞書を使っていないからで"
+"す。)新語への対応に `mecab-ipadic-NEologd : Neologism dictionary for MeCab "
+"<https://github.com/neologd/mecab-ipadic-neologd>`_ が役に立つかもしれませ"
+"ん。"
+
+msgid "``TokenMecab`` has optional parameter::"
+msgstr "``TokenMecab`` は、省略可能な引数があります。"
+
+msgid ""
+"Here is an example of ``TokenMeCab``. ``東京都`` is tokenized to ``東京`` "
+"and ``都``. They don't include ``京都``:"
+msgstr ""
+"以下は ``TokenMeCab`` の例です。 ``東京都`` は ``東京`` と ``都`` にトークナ"
+"イズされています。 ``京都`` というトークンはありません。"
+
+msgid ""
+"``TokenMecab`` can also specify options. ``TokenMecab`` has ``target_class`` "
+"option, ``include_class`` option, ``include_reading`` option, "
+"``include_form`` option and ``use_reading`` option."
+msgstr ""
+"``TokenMecab`` はオプションを指定することもできます。``TokenMecab`` は、"
+"``target_class`` オプション、 ``include_class`` オプション、 "
+"``include_reading`` オプション、 ``include_form`` オプションと "
+"``use_reading`` オプションがあります。"
+
+msgid ""
+"``target_class`` option searches a token of specifying a part-of-speech. For "
+"example, you can search only a noun as below."
+msgstr ""
+"``target_class`` オプションは、指定した品詞のトークンを検索します。例えば、以"
+"下のように名詞のみを検索できます。"
+
+msgid ""
+"``include_class`` option outputs class and subclass in Mecab’s metadata as "
+"below."
+msgstr ""
+"``include_class`` オプションは、以下のようにMecabのメタデータのclassと"
+"subclassを出力します。"
+
+msgid ""
+"You can exclude needless token with ``target_class`` and class and sub class "
+"of this option outputs."
+msgstr ""
+"このオプションで出力するclassとsubclassと ``target_class`` で不要なトークンを"
+"取り除くことができます。"
+
+msgid "``include_reading`` outputs reading in Mecab’s metadata as below."
+msgstr ""
+"``include_reading`` は以下のように、Mecabのメタデータのreadingを出力します。"
+
+msgid "You can get reading of a token with this option."
+msgstr "このオプションを使って、トークンの読みを取得できます。"
+
+msgid ""
+"``include_form`` outputs inflected_type, inflected_form and base_form in "
+"Mecab’s metadata as below."
+msgstr ""
+"``include_form`` は、以下のようにMecabのメタデータのinflected_typeと"
+"include_formを出力します。"
+
+msgid ""
+"``use_reading`` supports a search by kana. This option is useful for "
+"countermeasure of orthographical variants because it searches with kana."
+msgstr ""
+"``use_reading`` は、読みがなによる検索をサポートします。このオプションは、読"
+"みがなを使った検索をするため、表記ゆれの対策として有用です。"
+
+msgid ""
+"``target_class`` option can also specify subclasses and exclude or add "
+"specific part-of-speech of specific using + or -. So, you can also search a "
+"noun with excluding non-independent word and suffix of person name as below."
+msgstr ""
+"``target_class`` オプションは、サブクラスを指定することや、 + や - を使って、"
+"特定の品詞を追加または、除外することもできます。したがって、以下のように人名"
+"の接尾語と非自立語を除いた名詞を検索することもできます。"
+
+msgid "In this way you can search exclude the noise of token."
+msgstr "このようにして、ノイズとなるトークンを除外して検索できます。"
+
+msgid ""
+"In addition, you can get reading of a token that exclude the noise with "
+"``include_reading`` option as below."
+msgstr ""
+"加えて、以下のように ``include_reading`` を使って、ノイズを除去したトークンの"
+"読みがなを取得できます。"
+
+msgid ""
+"There are four optional parameters ``include_class`` , ``target_class`` , "
+"``include_form`` and ``use_reading`` ."
+msgstr ""
+"省略可能引数は4つあります。 ``include_class`` 、 ``target_class`` 、 "
+"``include_form`` と ``use_reading`` です。"
+
+msgid "``include_class``"
+msgstr ""
+
+msgid "Outputs class and subclass in Mecab’s metadata."
+msgstr "Mecabのメタデータのclassとsubclassを出力します。"
+
+msgid "``target_class``"
+msgstr ""
+
+msgid "Outputs a token of specifying a part-of-speech."
+msgstr "指定した品詞のトークンを出力します。"
+
+msgid "``include_form``"
+msgstr ""
+
+msgid ""
+"Outputs inflected_type, inflected_form and base_form in Mecab’s metadata."
+msgstr "Mecabのメタデータのinflected_typeとinflected_formを出力します。"
+
+msgid "``use_reading``"
+msgstr ""
+
+msgid "Outputs reading of token."
+msgstr "トークンの読みがなを出力します。"
+
 msgid "Tuning"
 msgstr "チューニング"
 
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.osdn.me/mailman/archives/groonga-commit/attachments/20181228/5bd42531/attachment-0001.html>


More information about the Groonga-commit mailing list
Back to archive index