argra****@users*****
argra****@users*****
2013年 4月 2日 (火) 04:18:16 JST
Index: docs/perl/5.12.1/perlrecharclass.pod diff -u docs/perl/5.12.1/perlrecharclass.pod:1.1 docs/perl/5.12.1/perlrecharclass.pod:1.2 --- docs/perl/5.12.1/perlrecharclass.pod:1.1 Thu Feb 28 20:02:15 2013 +++ docs/perl/5.12.1/perlrecharclass.pod Tue Apr 2 04:18:15 2013 @@ -60,9 +60,9 @@ Perl 正規表現には 3 種類の文字クラスがあります: ドット、 逆スラッシュシーケンス、大かっこで囲まれた形式です。 -Keep in mind, though, that often the term "character class" is used -to mean just the bracketed form. This is true in other Perl documentation. -(TBT) +しかし、「文字クラス」という用語はしばしば大かっこ形式だけを意味するために +使われることに注意してください。 +これはその他の Perl 文書では真です。 =head2 The dot @@ -239,9 +239,8 @@ C<\w> は単語全体ではなく、単一の英数字(つまり英字または数字)または 下線(C<_>)にマッチングします。 -Use C<\w+> to match -a string of Perl-identifier characters (which isn't the same as matching an -English word). +Perl 識別子文字の文字列にマッチングするために C<\w+> を使います (これは +英単語にマッチングするものと同じではありません)。 何が単語文字と考えられるかは文字列の内部エンコーディングと有効なロケールや EBCDIC コードページに依存します。 UTF-8 形式の場合、C<\w> は Unicode データベースで単語文字と考えられるものに @@ -253,7 +252,6 @@ ロケールや EBCDIC コードページなしの場合、C<\w> は ASCII 文字、数字、下線に マッチングします。 L</Locale, EBCDIC, Unicode and UTF-8> を参照してください。 -(TBT) =begin original @@ -322,11 +320,8 @@ =end original C<\h> は水平空白と考えられる任意の文字にマッチングします; これはスペースと -タブ文字および -17 other characters that are -listed in the table below. +タブ文字および以下の表に上げられている 17 のその他の文字です。 C<\H> は水平空白と考えられない文字にマッチングします。 -(TBT) =begin original @@ -367,10 +362,8 @@ =end original C<\v> は垂直空白と考えられる任意の文字にマッチングします; これは復帰と -行送り(改行)文字 plus 5 -other characters listed in the table below です。 +行送り(改行)文字に加えて以下の表に上げられている五つのその他の文字です。 C<\V> は垂直空白と考えられない任意の文字にマッチングします。 -(TBT) =begin original @@ -385,9 +378,9 @@ C<\R> は Unicode の規則で改行と考えられるものにマッチングします。 複数文字の並びにマッチングすることもあるので、これは 文字クラスではありません。 -従って、大かっこ文字クラスの中では使えません; use C<\v> instead (vertical whitespace). +従って、大かっこ文字クラスの中では使えません; 代わりに C<\v> (垂直空白) を +使ってください。 詳細は L<perlrebackslash> で議論しています。 -(TBT) =begin original @@ -419,14 +412,12 @@ これは正しくありません。 垂直タブ (C<"\x0b">) は C<\s> にマッチングしませんが、垂直空白と 考えられます。 -さらに、ソース文字列が UTF-8 形式でなければ、 -and any locale or EBCDIC code page that is in effect doesn't include them, -next line (C<"\x85">) と +さらに、ソース文字列が UTF-8 形式でないか、これらを含まないロケールや +EBCDIC コードページが有効でなければ、next line (C<"\x85">) と no-break space (C<"\xA0">) 文字は C<\s> にマッチングしませんが、 それぞれ C<\v> および C<\h> にはマッチングします。 ソース文字列が UTF-8 形式なら、next line と no-break space は C<\s> に マッチングします。 -(TBT) =begin original @@ -449,9 +440,8 @@ 最初の列は文字の符号位置(16 進形式)、2 番目の列は (Unicode の)名前です。 3 番目の列はどのクラスにマッチングするかを示しています -(assuming no locale or EBCDIC code -page is in effect that changes the C<\s> matching)。 -(TBT) +(C<\s> のマッチングを変更するようなロケールや EBCDIC コードページが +有効でないことを仮定しています)。 0x00009 CHARACTER TABULATION h s 0x0000a LINE FEED (LF) vs @@ -491,10 +481,8 @@ =end original -NEXT LINE と NO-BREAK SPACE はソース文字列が UTF-8 形式か -or the locale or EBCDIC code page that is in effect includes them -C<\s> にマッチングします。 -(TBT) +NEXT LINE と NO-BREAK SPACE はソース文字列が UTF-8 形式か、これらを含む +ロケールや EBCDIC コードページが有効の場合にのみ C<\s> にマッチングします。 =back @@ -540,10 +528,9 @@ マッチングする文字クラスです。 一文字特性は C<\pP> 形式で、C<\p> に引き続いて特性名です; さもなければ 中かっこが必要です。 -When using braces, there is a single form, which is just the property name -enclosed in the braces, and a compound form which looks like C<\p{name=value}>, -which means to match if the property "name" for the character has the particular -"value". +中かっこを使うとき、単に特性名を中かっこで囲んだ単一形式と、 +C<\p{name=value}> のような形で、文字の特性 "name" が特定の "value" を +持つものにマッチングすることになる複合形式があります。 例えば、数字にマッチングするものは C</\pN/> または C</\p{Number}/> または C</\p{Number=True}/> と書けます。 小文字は I<LowercaseLetter> 特性にマッチングします; これには @@ -553,7 +540,6 @@ C</\pLl/> も妥当ですが、違う意味になります。 これは 2 文字にマッチングします: 英字 (Unicode 特性 C<\pL>)に引き続いて 小文字の C<l> です。 -(TBT) =begin original @@ -565,12 +551,13 @@ =end original -For more details, see L<perlunicode/Unicode Character Properties>; for a -complete list of possible properties, see -L<perluniprops/Properties accessible through \p{} and \P{}>. +さらなる詳細については、 L<perlunicode/Unicode Character Properties> を +参照してください; 特性の完全な一覧については +L<perluniprops/Properties accessible through \p{} and \P{}> を参照して +ください。 独自の特性を定義することも可能です。 -これは L<perlunicode/User-Defined Character Properties> で議論されています。 -(TBT) +これは L<perlunicode/User-Defined Character Properties> で +議論されています。 =head4 Examples @@ -764,7 +751,7 @@ =end original -The sequences +並び C<\a>, C<\c>, C<\e>, @@ -774,11 +761,8 @@ C<\N{U+I<wide hex char>}>, C<\r>, C<\t>, -and C<\x> -are also special and have the same meanings as they do outside a bracketed character -class. -(TBT) +も特別で、大かっこ文字クラスの外側と同じ意味を持ちます。 =begin original @@ -787,9 +771,8 @@ =end original -Also, a backslash followed by two or three octal digits is considered an octal -number. -(TBT) +また、逆スラッシュに引き続いて 2 または 3 桁の 8 進数字があると 8 進数として +扱われます。 =begin original @@ -1084,11 +1067,9 @@ Posix 文字クラスは C<[:class:]> の形式で、I<class> は名前、C<[:> と C<:]> は デリミタです。 Posix 文字クラスは大かっこ文字クラスの I<内側> にのみ現れ、文字のグループを -一覧するのに便利で記述的な方法ですが、 -though they currently suffer from -portability issues (see below and L<Locale, EBCDIC, Unicode and UTF-8>). +一覧するのに便利で記述的な方法ですが、現在の所移植性の問題に影響を与えます +(下記と L<Locale, EBCDIC, Unicode and UTF-8> を参照してください)。 文法について注意してください、 -(TBT) # Correct: $string =~ /[[:alpha:]]/ @@ -1107,9 +1088,8 @@ 後者のパターンは、コロンおよび C<a>, C<l>, C<p>, C<h> の文字からなる 文字クラスです。 -These character classes can be part of a larger bracketed character class. For -example, -(TBT) +これら文字クラスはより大きな大かっこ文字クラスの一部にできます。 +例えば、 [01[:alpha:]%] @@ -1119,8 +1099,7 @@ =end original -is valid and matches '0', '1', any alphabetic character, and the percent sign. -(TBT) +これは妥当で、'0'、'1'、任意の英字、パーセントマークにマッチングします。 =begin original @@ -1128,7 +1107,7 @@ =end original -Perl 以下の POSIX 文字クラスを認識します: +Perl は以下の POSIX 文字クラスを認識します: =begin original @@ -1293,8 +1272,7 @@ =end original -C<\p{Blank}> and C<\p{HorizSpace}> are synonyms. -(TBT) +C<\p{Blank}> と C<\p{HorizSpace}> は同義語です。 =item [2] @@ -1309,9 +1287,8 @@ 制御文字はそれ自体は出力されず、普通は何か端末を制御します: 例えば 改行と後退は制御文字です。 -In the ASCII range, characters whose ordinals are between 0 and 31 inclusive, -plus 127 (C<DEL>) are control characters. -(TBT) +ASCII の範囲では、序数が 0 から 31 までの範囲の文字および 127 (C<DEL>) が +制御文字です。 =begin original @@ -1503,10 +1480,8 @@ C<\w>, C<\d>, C<\s> および POSIX 文字クラス (および C<\W>, C<\D>, C<\S> を 含むこれらの否定) はこの振る舞いの影響を受けます。 -(Since the backslash -sequences C<\b> and C<\B> are defined in terms of C<\w> and C<\W>, they also are -affected.) -(TBT) +(逆スラッシュシーケンス C<\b> と C<\B> は C<\w> と C<\W> の点から +定義されているので、これらも影響を受けます。) =begin original Index: docs/perl/5.12.1/perlunicode.pod diff -u docs/perl/5.12.1/perlunicode.pod:1.4 docs/perl/5.12.1/perlunicode.pod:1.5 --- docs/perl/5.12.1/perlunicode.pod:1.4 Wed Sep 12 05:28:20 2012 +++ docs/perl/5.12.1/perlunicode.pod Tue Apr 2 04:18:15 2013 @@ -1066,8 +1066,7 @@ =end original -A complete list of scripts and their shortcuts is in L<perluniprops>. -(TBT) +用字とその省略形の完全な一覧は L<perluniprops> にあります。 =head3 B<Use of "Is" Prefix> @@ -1111,8 +1110,7 @@ B<用字> に加え、Unicode では文字の B<ブロック> を定義しています。 用字とブロックの違いは、用字のコンセプトが自然言語に -密着したものであるのに対して、ブロックのコンセプトは -連続した番号を持つ +密着したものであるのに対して、ブロックのコンセプトは連続した番号を持つ Unicode 文字のグループに基づいたより人工的なグループ分けであることです。 たとえば、"Basic Latin" ブロックは番号 0 から 127 までの全ての文字、 言い換えると ASCII 文字です。 @@ -1121,12 +1119,9 @@ それらのブロックのすべての文字を含んではいません。 例を挙げると、数字は多くの用字を越えて共有されているので、 (Latin 用字は)数字を含みません。 -数字と、句読点のような同様のグループは C<Common> と呼ばれる -用字にあります。 -There is also a script called C<Inherited> for -characters that modify other characters, and inherit the script value of the -controlling character. -(TBT) +数字と、句読点のような同様のグループは C<Common> と呼ばれる用字にあります。 +他の文字を修正して、制御文字の用字の値を継承する文字のための C<Inherited> と +呼ばれる用字もあります。 =begin original @@ -1233,8 +1228,7 @@ =end original -A complete list of blocks and their shortcuts is in L<perluniprops>. -(TBT) +ブロックとその省略形の完全な一覧は L<perluniprops> にあります。 =head3 B<Other Properties> @@ -1247,9 +1241,8 @@ =end original -There are many more properties than the very basic ones described here. -A complete list is in L<perluniprops>. -(TBT) +ここで記述したとても基本的なものよりもとても多くの特性があります。 +完全な一覧は L<perluniprops> です。 =begin original @@ -1292,9 +1285,8 @@ =end original -This matches any of the 1_114_112 Unicode code points. It is a synonym for -C<\p{Any}>. -(TBT) +これは任意の 1_114_112 Unicode 符号位置にマッチングします。 +これは C<\p{Any}> の同義語です。 =item B<C<\p{Alnum}>> @@ -1304,8 +1296,8 @@ =end original -This matches any C<\p{Alphabetic}> or C<\p{Decimal_Number}> character. -(TBT) +これは任意の C<\p{Alphabetic}> または C<\p{Decimal_Number}> 文字に +マッチングします。 =item B<C<\p{Any}>> @@ -1316,9 +1308,8 @@ =end original -This matches any of the 1_114_112 Unicode code points. It is a synonym for -C<\p{All}>. -(TBT) +これは任意の 1_114_112 Unicode 符号位置にマッチングします。 +これは C<\p{All}> の同義語です。 =item B<C<\p{Assigned}>> @@ -1329,9 +1320,8 @@ =end original -This matches any assigned code point; that is, any code point whose general -category is not Unassigned (or equivalently, not Cn). -(TBT) +これは任意の割り当てられた符号位置にマッチングします; つまり、一般カテゴリが +Unassigned ではない(または同等に Cn ではない) 符号位置です。 =item B<C<\p{Blank}>> @@ -1342,9 +1332,8 @@ =end original -This is the same as C<\h> and C<\p{HorizSpace}>: A character that changes the -spacing horizontally. -(TBT) +これは C<\h> および C<\p{HorizSpace}> と同じです: スペースを垂直に変更する +文字です。 =item B<C<\p{Decomposition_Type: Non_Canonical}>> (Short: C<\p{Dt=NonCanon}>) @@ -1354,8 +1343,7 @@ =end original -Matches a character that has a non-canonical decomposition. -(TBT) +非正準分解文字にマッチングします。 =begin original @@ -1513,8 +1501,7 @@ =end original -This is a synonym for C<\p{Present_In=*}> -(TBT) +これは C<\p{Present_In=*}> の同義語です。 =item B<C<\p{PerlSpace}>> @@ -1533,8 +1520,7 @@ =end original -Mnemonic: Perl's (original) space -(TBT) +記憶法: Perl の (元々の) スペース =item B<C<\p{PerlWord}>> @@ -1553,8 +1539,7 @@ =end original -Mnemonic: Perl's (original) word. -(TBT) +記憶法: Perl の (元々の) 単語。 =item B<C<\p{PosixAlnum}>> @@ -2708,9 +2693,9 @@ =end original -Read L<Unicode Security Considerations|http://www.unicode.org/reports/tr36>. -Also, note the following: -(TBT) +L<Unicode Security Considerations|http://www.unicode.org/reports/tr36> を +呼んでください。 +また、以下のことに注意してください: =over 4 @@ -3050,8 +3035,7 @@ =end original -The behavior is known to have effects on these areas: -(TBT) +この振る舞いは以下のような領域で影響があることが分かっています: =over 4 @@ -3118,9 +3102,9 @@ =end original -これの振る舞いにより、符号位置 255 を超える文字が追加されたり削除されたりすると、 -文字列のセマンティックスがバイトから文字へ(またはその逆へ)突然 -変更されるという予想外の結果を引き起こすことがあります。 +これの振る舞いにより、符号位置 255 を超える文字が追加されたり +削除されたりすると、文字列のセマンティックスがバイトから文字へ(または +その逆へ)突然変更されるという予想外の結果を引き起こすことがあります。 例えば、以下のようなプログラムとその出力を考えます: $ perl -le' @@ -3508,9 +3492,8 @@ =end original -Perl by default comes with the latest supported Unicode version built in, but -you can change to use any earlier one. -(TBT) +Perl はデフォルトでは最新の Unicode バージョンが組み込まれていますが、 +より古いものに変更することができます。 =begin original