\
: エスケープ用、あるいは特別な文字用 (後述)
^
: 文字列の先頭部分 (先頭文字ではない)
$
: 文字列の最後尾 (最後尾の文字ではない) .
: 任意の 1 文字
[
...]
: ...のいずれか 1 文字
[^
...]
: ...以外のいずれか 1 文字
[ ]
内の -
: から までの全ての文字
|
: 正規表現 または にマッチする文字列
(
)
: 正規表現 をグループ化
(
)?
または ?
:
(または ) がないかまたは 1 つだけある文字列
(
)*
または *
:
(または ) の 0 回以上の繰り返し
(
)+
または +
:
(または ) の 1 回以上の繰り返し
グループ化を意味する ( )
は、後ろに ?,*,+
を伴ったり、
|
を使うときに使われます。例えば、以下の通りです。
document(style|class)
= ``documentstyle'' かまたは ``documentclass''
(re)?newcommand
= ``newcommand'' かまたは ``renewcommand''
*
や +
等は、( )
の後ろ以外でも使用できます。
1[0-9]*
= 1 で始まる任意の桁の数字
<[^>]+>
= >
以外の任意の 1 文字以上の文字列を < >
で囲んだもの
[a-zA-Z]+
= 1 文字以上のアルファベット文字列
エスケープ用に使われる \
は、上記のような特別な文字の意味をなくす
のに使われます。例えば、
\"
= "
自体
\\
= \
自体
main\((void)?\)
= ``main()'' または ``main(void)''
またその他にも、C 言語でも用いられることがある 以下のような特別な文字を表すのにも使われます。
\a
: ベル
\b
: バックスペース
\f
: 改ぺージ
\n
: 改行
\r
: 復帰
\t
: タブ
\v
: 垂直タブ
\
: 8 進数 で表される数字
( は 0 から 7 までの 3 桁の数字)
\x
: 16 進数 で表される数字