argra****@users*****
argra****@users*****
2008年 8月 25日 (月) 02:45:09 JST
Index: docs/perl/5.10.0/perlfaq9.pod diff -u docs/perl/5.10.0/perlfaq9.pod:1.8 docs/perl/5.10.0/perlfaq9.pod:1.9 --- docs/perl/5.10.0/perlfaq9.pod:1.8 Mon Jul 21 05:42:15 2008 +++ docs/perl/5.10.0/perlfaq9.pod Mon Aug 25 02:45:09 2008 @@ -365,14 +365,13 @@ =end original -You can easily extract all sorts of URLs from HTML with -C<HTML::SimpleLinkExtor> which handles anchors, images, objects, -frames, and many other tags that can contain a URL. +アンカー、イメージ、オブジェクト、フレーム、およびその他の URL を含む +多くのタグを扱える C<HTML::SimpleLinkExtor> を使って、HTML からあらゆる +種類の URL を簡単に抽出できます。 もしもっと複雑なものが必要なら、自分自身で C<HTML::LinkExtor> や C<HTML::Parser> のサブクラスを作れます。 例えば、あなたの用途に特に適用するなら、C<HTML::SimpleLinkExtor> を 使うこともできます。 -(TBT) =begin original @@ -392,12 +391,11 @@ =end original -Less complete solutions involving regular expressions can save -you a lot of processing time if you know that the input is simple. One -solution from Tom Christiansen runs 100 times faster than most -module based approaches but only extracts URLs from anchors where the first -attribute is HREF and there are no other attributes. -(TBT) +もし入力が単純であることが分かっているなら、正規表現を使ったより不完全な +解法によって多くの処理時間を節約できます。 +Tom Christiansen による一つの解法は、モジュールを使った手法よりも 100 倍 +速いですが、最初の属性が HREF で、その他の属性がないアンカーの URL のみを +抽出します。 #!/usr/bin/perl -n00 # qxurl - tchri****@perl***** @@ -660,13 +658,11 @@ =end original (たとえ同じサーバでも)宛て先の完全な URL を指定してください。 -This is one of the two different kinds of CGI "Location:" -responses which are defined in the CGI specification for a Parsed Headers -script. -その他の種類 (絶対 URL パス) は HTTP リダイレクトなしにサーバーによって +これは Parsed Headers スクリプトとして CGI 仕様に定義された二つの異なった +CGI "Location:" レスポンスのうちの一つです。 +その他の種類 (絶対 URL パス) は HTTP リダイレクトなしにサーバによって 内部的に解決されます。 CGI 仕様ではどちらの場合でも相対 URL は認められていません。 -(TBT) =begin original @@ -959,13 +955,13 @@ もしあなたが単純な正規表現でアドレスがメールヘッダ標準に従っているかを 見ることでパート I<a> をチェックしたいなら、問題を抱えることになります; -because there are deliverable addresses that -aren't RFC-2822 (the latest mail header standard) compliant, and -addresses that aren't deliverable which, are compliant. However, the -following will match valid RFC-2822 addresses that do not have comments, -folding whitespace, or any other obsolete or non-essential elements. -This I<just> matches the address itself: -(TBT) +なぜなら、RFC-2822 (最新のメールヘッダ標準) に準拠してないけれども +配達可能なアドレスが存在し、標準に準拠しているけれども配達不能なアドレスも +存在するからです。 +しかし以下のコードは、コメント、折り畳みの空白、あるいはその他の時代遅れに +なっていたり本質的でない要素を含んでいない、有効な RFC-2822 アドレスに +マッチングします。 +これは I<単に> アドレス自身にマッチングします: my $atom = qr{[a-zA-Z0-9_!#\$\%&'*+/=?\^`{}~|\-]+}; my $dot_atom = qr{$atom(?:\.$atom)*};