100.3.5.1 度数分布 (bins)

書式:


    plot 'DATA' using <XCOL> {:<YCOL>} bins{=<NBINS>}
         {binrange [<LOW>:<HIGH>]} {binwidth=<width>}
         {binvalue={sum|avg}}

plot コマンドに対するオプション bins は、最初に元のデータを、x 軸 上で等しい幅を持ついくつかの階級 (ビン) に割り当て、そして階級毎に一つ の値のみを描画します。階級の数のデフォルト値は、set samples で決定し ますが、これは plot コマンドでビンの数を明示的に指定することで変更でき ます。

binrange を指定しないと、範囲は 'DATA' 内の値の両端を取ります。

階級幅は、指定した範囲と階級の数から自動的に計算し、各点を 0 から NBINS-1 までの階級に割り当てます:


    BINWIDTH = (HIGH - LOW) / (NBINS-1)
    xmin = LOW - BINWIDTH/2
    xmax = HIGH + BINWIDTH/2
    first bin holds points with (xmin <= x < xmin + BINWIDTH)
    最初の階級は (xmin <= x < xmin + BINWIDTH) の範囲の点を保持
    最後の階級は (xmax-BINWIDTH <= x < xman) の範囲の点を保持
    各点は i = floor(NBINS * (x-xmin)/(xmax-xmin)) 番の階級に割り当て

それとは別に、固定幅の階級を指定することも可能です。その場合、階級の数 (nbins) は、点の範囲全体にわたる最小の階級の数となります。

階級の出力は、その中点で描画、または表にされます。例えば gnuplot が上 のように階級の幅を計算する場合、最初の階級の x 座標の出力は x=LOW であ り、x=xmin ではありません。

using 命令で一つの列のみを指定した場合、各データ点は、その x 座標値に 対する階級の合計値に 1 だけ寄与します。2 列目を指定すると、その階級の 合計値には 2 列目の値が追加されます。よって、以下の 2 つの plot コマン ドは同じになります:


    plot 'DATA" using N bins=20
    set samples 20
    plot 'DATA' using (column(N)):(1)

デフォルトでは、各階級に対して描画される y の値は、その階級内のすべて の点に関する y の値の和になります。これは、オプション binvalue=sum に対応します。これに対して、binvalue=avg ではその階級内のすべての点 に対する y の値の平均を描画します。

関連する処理オプションに関しては、以下参照: smooth frequency (100.3.8.10), smooth kdensity (100.3.8.14)

竹野茂治@新潟工科大学
2024-12-02