次へ: 3 Yahoo! ニュース記事の構造
上へ: AWK による HTML ファイルの整形
前へ: 1 はじめに
(PDF ファイル: awkhtml.pdf)
2 HTML のおおまかな仕組み
HTML とは、HyperText Markup Language の略で、
WWW ページ文書を書くための書式を決めたものです。
我々が普段見ている WWW ページ (何とか.html の形式のページ) は
ほぼすべてがこの規格に従って書かれています。
HTML は、文書の見た目の構造や論理的な構造をタグと呼ばれる
マークアップ (印付け) によって示すやり方2を取っていて、
文書の中にこのタグを含めて書いていきます。
HTML のタグは、
のように、ペアのタグで文書の部分を囲むものと、
のように、単独のタグで意味を持つものの 2 種類に大きく分かれます。
HTML 文書の基本的な構造は、以下のようになります:
<html>
<head>
<title>タイトル</title>
</head>
<body>
本文
</body>
</html>
上にも見られますが、いくつか HTML 文書での決まりを上げます。
- 文書中の改行は入れても入れなくても表示とはあまり関係はなく、
HTML ファイルの本文中の改行は表示ではスペース一つと同じ意味になる
(強制的に改行するには明示的に改行タグを書き入れる)
- タグ名のアルファベットは大文字でも小文字でも構わず、
同じ意味になる4
- タグで囲んだ文書中にまたタグを使うこともできるが、
その場合内側のタグ部分を終了させてから外側のタグ部分を終了させるように
書く
- タグにはオプションをつけることができるものもあり、その場合は、
<タグ名 オプション名="その値" ...> のように書く。
次に、上で示したいくつかのタグの意味を紹介します。
- <html></html>: HTML 部分を明示するタグ。
通常 HTML ページ全体がこれで囲まれる5。
その中味はヘッダと本文に大きく分かれる。
- <head></head>: HTML のヘッダ部分を囲むタグ。
ヘッダにはタイトルや著者、使用言語などが書かれる。
この部分はブラウザには表示されない。
- <title></title>: この HTML ファイルのタイトルを定義するタグ。
このタイトルは本文に表示されるわけではなく、
通常はブラウザの上部のタイトルバーに表示されるか、
ブックマークの登録時にこの WWW ページの名称として利用される。
- <body></body>: HTML 本文を囲むタグ。
オプションとして本文の背景色などを指定することができる。
基本的にこの部分がブラウザに表示される。
この他にも、文字の大きさ、改行、見出し、箇条書きなどに関する多くのタグが
ありますが、今回利用する HTML ファイルに含まれる主要なタグを以下に紹介します。
- <br>: 強制改行
- <hr>: 水平線 改行
- <b></b>: タグで囲んだ部分を太字にする
- <font></font>: オプションを使って、タグで囲んだ部分の表示に使用する
フォント、サイズ、色などを指定する
- <small></small>: タグで囲んだ部分を小さな文字にする
- <center></center>: タグで囲んだ部分を中央揃えする
- <h[]></h[]>: タグで囲んだ部分を見出しとする
([] は 1 から 6 まで、1 が最も大きい見出し)
- <a></a>: オプションを使って、タグで囲んだ部分にリンクを貼ったり、
逆にここをリンク先とするための名前をつけたりする
- <div></div>: タグで囲んだ部分をブロックとして、
オプションの値に従って位置合わせなどを行う
- <table></table>: タグで囲んだ部分を表として作成する
- <tr></tr>: <table> タグ内の表の行の要素を意味する
- <td></td>: <tr> タグ内の列の要素を意味する
- <script></script>: Javascript 等の定義部分
- <noscript></noscript>: Javascript 非対応のブラウザ用の定義部分
- <form></form>: 入力フォーム定義部分
- <img>: オプションで指定した画像を貼りつける
<!--
-->
: コメント (表示や機能とは無関係)
HTML で利用可能なタグの一覧や詳細については、HTML のタグ辞典
([7], [8] など) や、
HTML タグを紹介するサイト ([9] など) などを参照してください。
次へ: 3 Yahoo! ニュース記事の構造
上へ: AWK による HTML ファイルの整形
前へ: 1 はじめに
竹野茂治@新潟工科大学
2006年8月14日