87.23 文字エンコード (encoding)

コマンド set encoding は文字のエンコード (encoding) を選択します。

書式:

     set encoding {<value>}
     set encoding locale
     show encoding

有効な値 (value) は以下の通りです。

  default     - 出力形式にデフォルトのエンコードの使用を命令
  iso_8859_1  - 多くの Unix ワークステーションや MS-Windows で使用可
                能な最も一般的な西ヨーロッパエンコード。このエンコー
                ドは PostScript の世界で 'ISO-Latin1' として知られて
                いるものです。
  iso_8859_15 - ユーロ記号を含む iso_8859_1 の亜種
  iso_8859_2  - 中央/東ヨーロッパで使用されるエンコード
  iso_8859_9  - (Latin5 として知られる) トルコで使用されるエンコード
  koi8r       - 良く使われる Unix のキリル文字エンコード
  koi8u       - Unix のウクライナ地方のキリル文字エンコード
  cp437       - MS-DOS のコードページ
  cp850       - 西ヨーロッパの OS/2 のコードページ
  cp852       - 中央/東ヨーロッパの OS/2 のコードページ
  cp950       - MS 版の Big5 (emf terminal のみ)
  cp1250      - 中央/東ヨーロッパの MS Windows のコードページ
  cp1251      - ロシア、セルビア、ブルガリア、マケドニア語 (8 ビット)
  cp1252      - 西ヨーロッパの MS Windows のコードページ
  cp1254      - トルコの MS Windows のコードページ (Latin5 の拡張)
  sjis        - Shift_JIS 日本語エンコード
  utf8        - 各文字の Unicode エントリポイントの、可変長 (マルチバ
                イト) 表現

コマンド set encoding locale は、他のオプションとは違い、これは現在 のロカールを実行時の環境から決定しようとします。たいていのシステムでは これは環境変数 LC_ALL, LC_CTYPE, LANG のいずれかによって制御されます。 この仕組みは、例えば wxt, cairopdf 出力形式で、UTF-8 や EUC-JP のよう なマルチバイト文字エンコードを通すために必要です。このコマンドは日付や 数字などのロカール特有の表現には影響を与えません。 以下も参照: set locale (87.40), set decimalsign (87.20)

一般に、エンコードの設定は出力形式の設定の前に行なう必要があります。こ のエンコードはどんな出力形式でもサポートされているとは限らず、そして出 力形式は要求されたどんな非標準文字も生成できなければいけません。

竹野茂治@新潟工科大学
2015年1月5日