36 Boxplot

Image figure_boxplot
boxplot は、値の統計的な分布を表現する一般的な方法です。四分位境界は、 1/4 の点が第一四分位境界以下の値を持つように、1/2 の点が第二四分位境界 (メジアン) 以下の値を持つように、等と決定されます。第一四分位と第三四 分位の間の領域を囲むように箱を描画し、メジアン値のところには水平線を描 きます。箱ひげは、箱からユーザ指定限界まで延長されます。それらの限界の 外にある点は、ひとつひとつ描画されます。

例:


   # x 座標は 1.0、y は 5 列目の値のところに boxplot を配置
   plot 'data' using (1.0):5


   # 上と同じだが、範囲外の点は隠し、boxplot の幅を 0.3 にする
   set style boxplot nooutliers
   plot 'data' using (1.0):5:(0.3)

デフォルトでは、using 指定による 2 列目の y のすべての値に対する boxplot を 1 つだけ生成します。しかし、追加の (4 つ目の) 列を指定する と、その列の値をある因子変数の離散的なレベル値であると見なし、その離散 値のレベルの値の数だけの boxplot を描画します。それらの boxplot の間隔 はデフォルトでは 1.0 ですが、これは set style boxplot separation で 変更できます。デフォルトでは、因子変数の値は、各 boxplot の下 (または 上) の目盛りのラベルに表示します。


   # 'data' の 2 列目は "control" か "treatment" のいずれかの文字列で
   # 以下の例は、その因子毎の 2 つの boxplot を生成する
   plot 'data' using (1.0):5:(0):2

その箱のデフォルトの幅は set boxwidth <width> で設定できますが、plot コマンドの using による 3 番目のオプション列でも指定できます。1 番目 と 3 番目の列 (x 座標と幅) は通常データ列ではなく定数として与えます。

デフォルトでは、箱ひげは箱の端から、y の値が四分位範囲の 1.5 倍の中に 収まっていて最も離れているような点まで延長されます。デフォルトでは、範 囲外の点 (outlier) は円 (pointtype 7) で描かれます。箱ひげの端の棒の幅 は set bars または set errorbars を使って制御できます。

これらのデフォルトの性質は set style boxplot コマンドで変更できます。 以下参照: set style boxplot, bars, boxwidth, fillstyle, candlesticks

竹野茂治@新潟工科大学
2023-02-13