100.24 文字エンコード (encoding)

コマンド set encoding は文字のエンコード (encoding) を選択します。

書式:

     set encoding {<value>}
     set encoding locale
     show encoding

有効な値 (value) は以下の通りです。

  default     - 出力形式にデフォルトのエンコードの使用を命令
  iso_8859_1  - UTF-8 より最も一般的な西ヨーロッパエンコード。このエ
                ンコードは PostScript の世界での 'ISO-Latin1' です。
  iso_8859_15 - ユーロ記号を含む iso_8859_1 の亜種
  iso_8859_2  - 中央/東ヨーロッパで使用されるエンコード
  iso_8859_9  - (Latin5 として知られる) トルコで使用されるエンコード
  koi8r       - 良く使われる Unix のキリル文字エンコード
  koi8u       - Unix のウクライナ地方のキリル文字エンコード
  cp437       - MS-DOS のコードページ
  cp850       - 西ヨーロッパの OS/2 のコードページ
  cp852       - 中央/東ヨーロッパの OS/2 のコードページ
  cp950       - MS 版の Big5 (emf terminal のみ)
  cp1250      - 中央/東ヨーロッパの MS Windows のコードページ
  cp1251      - ロシア、セルビア、ブルガリア、マケドニア語 (8 ビット)
  cp1252      - 西ヨーロッパの MS Windows のコードページ
  cp1254      - トルコの MS Windows のコードページ (Latin5 の拡張)
  sjis        - Shift_JIS 日本語エンコード
  utf8        - 各文字の Unicode エントリポイントの、可変長 (マルチバ
                イト) 表現

コマンド set encoding locale は、他のオプションとは違い、これは現在 のロカールを実行時の環境から決定しようとします。たいていのシステムでは これは環境変数 LC_ALL, LC_CTYPE, LANG のいずれかによって制御されます。 この仕組みは、例えば wxt, pdf 出力形式で、UTF-8 や EUC-JP のよう なマルチバイト文字エンコードを通すために必要です。このコマンドは日付や 数字などのロカール特有の表現には影響を与えません。 以下も参照: set locale (100.44), set decimalsign (100.21)

一般にエンコードの設定は、それが適切なフォントの選択に影響を与えるよう に、出力形式の設定の前に行なう必要があります。

竹野茂治@新潟工科大学
2022-07-20