次へ: 6.5 サブルーチンと END ブロック部分 上へ: 6 各部分の構成 前へ: 6.3 記事本文の取得部分 (PDF ファイル: awkhtml.pdf)

6.4 Copyright 以下の部分の取得部分

最後は、3 節の 4. の Copyright 以下の部分の取得ですが、 これは以下のようにします。
  ##### Copyright 以下の部分の取得 #####
  ($0 ~ /\/YBB module/){
      while($0 !~ /Copyright/) 
        if(getline<=0){ errorexit=8; exit }
      N_tail=0
      do{
          gsub(/<\/?small>/,"")
          gsub(/<\/?center>/,"")
          tail[++N_tail]=$0
      }while($0 !~ /<\/html>/ && getline>0)
      exit
  }
ここでは、``/YBB module'' というキーワード以後の、 ``Copyright'' 以下の文を </html> まで tail という配列に取得しています。 その際、small タグと center タグは削除しています。


次へ: 6.5 サブルーチンと END ブロック部分 上へ: 6 各部分の構成 前へ: 6.3 記事本文の取得部分
竹野茂治@新潟工科大学
2006年8月14日