今回のスクリプトは、 最初の BEGIN ブロックには 分野に特化したパターンを定義する必要がありますので、 もちろん分野に依存しているのですが、 3 節の全体のソースコードを見ればわかりますが、 その BEGIN ブロック以外は分野には依存していません。 よって、BEGIN ブロックだけすげかえれば、 他の部分は社会ニュース用、コンピュータニュース用などの 他の分野にも使いまわしができます。
このような場合てっとりばやいのは、 実際にファイルをコピーして、 その BEGIN ブロック部分だけ書き直す、という方法ですが、 そういう方法だと、 共通部分にバグがあって修正するとか、改良するとかという場合に、 すべてのスクリプトの同じ箇所を修正する、改変する、 ということをしなければなりません。
しかしそれ以外に、「スクリプトを分割」して、 共通部分は一つのファイルにして共有する、という手があります。 C 言語で言えば「ライブラリ化」ということに相当します。
AWK では、複数のスクリプトを複数の -f オプションで 読み込ませることができます。
awk -f script1.awk -f script2.awk ... datafile複数のスクリプトファイルは、 それらが連結された一つの大きなスクリプトであるとみなされます。
逆に言えば、今回のスクリプトを BEGIN ブロックと それ以降のスクリプトに分離すれば、 それ以降の部分は他のスクリプトでも 上のようにすることで共通に利用できます。
また、複数のスクリプトで BEGIN ブロックなどを それぞれ持つこともできますが、 それもそれらをつなげた一つのスクリプト内に複数の BEGIN ブロックが あることと同じで、 データを読み込む前に、最初に現われた BEGIN ブロックから 順に BEGIN ブロックの処理が行われていくだけです。