次へ: 3 Yahoo! ニュース記事の構造 上へ: AWK による HTML ファイルの整形 前へ: 1 はじめに (PDF ファイル: awkhtml.pdf)


2 HTML のおおまかな仕組み

HTML とは、HyperText Markup Language の略で、 WWW ページ文書を書くための書式を決めたものです。 我々が普段見ている WWW ページ (何とか.html の形式のページ) は ほぼすべてがこの規格に従って書かれています。

HTML は、文書の見た目の構造や論理的な構造をタグと呼ばれる マークアップ (印付け) によって示すやり方2を取っていて、 文書の中にこのタグを含めて書いていきます。

HTML のタグは、

のように、ペアのタグで文書の部分を囲むものと、 のように、単独のタグで意味を持つものの 2 種類に大きく分かれます。

HTML 文書の基本的な構造は、以下のようになります:

<html>
<head> <title>タイトル</title>
</head>
<body>
本文
</body>
</html>
上にも見られますが、いくつか HTML 文書での決まりを上げます。

次に、上で示したいくつかのタグの意味を紹介します。

この他にも、文字の大きさ、改行、見出し、箇条書きなどに関する多くのタグが ありますが、今回利用する HTML ファイルに含まれる主要なタグを以下に紹介します。

HTML で利用可能なタグの一覧や詳細については、HTML のタグ辞典 ([7], [8] など) や、 HTML タグを紹介するサイト ([9] など) などを参照してください。


次へ: 3 Yahoo! ニュース記事の構造 上へ: AWK による HTML ファイルの整形 前へ: 1 はじめに
竹野茂治@新潟工科大学
2006年8月14日