行の取得は、4 節で述べた getline を使う方法を使い、 行から必要な部分文字列を取得するには、5 節で述べた sub(), gsub() を使う方法で行うことにします。
まず、3 節の 1. の <title></title> の取得は以下のようにします。
##### タイトルの取得 ##### ($0 ~ /<title>/){ titlestr=$0 while(titlestr !~ /<\/title>/){ if(getline<=0){ errorexit=1; exit } titlestr = titlestr $0 } sub(/.*<title>[ \t]*/,"",titlestr) sub(/[ \t]*<\/title>.*/,"",titlestr) next }