4 メジアンと平均の関係

本節では、主に 3 節で求めた連続的な、 そして幾何学的な意味を持つ表現である (4), (7) を元に、 メジアンと平均の簡単な関係を考えてみる。 とりあえずは、 「$M_n<M_e$ のときにどのような分布になっているかを知ること」を目標とする。

もし分布が左右対称であれば、$M_n$$M_e$ もその中心に一致することは、 3 節で説明した $M_n$, $M_e$ の意味からすぐにわかる。

図 4: 左右対称なヒストグラム
\includegraphics[width=0.5\textwidth ]{hist-sym.eps}

左右対称とは限らない分布で考えると、 $M_e$ は中央値であるから、 $x=M_e$ で左右に分けたときにその左右の部分の面積は同じであり、 その右側の一部分を切り離して、その右側の範囲を移動した分布を考えても $M_e$ の値は変化しない (図 5)。

図 5: $M_e$ の右側の一部を移動
\includegraphics[width=0.5\textwidth ]{hist-move.eps}

一方、$M_n$ の方は、図形の重心の $x$ 座標であるから、 そのような操作によって $M_n$ の位置は変化し、 一部分を右へ移動すれば重心も右へ移動するから、 $M_n$ の値も大きくなることになる。

例えば一定に増加するようなヒストグラム、 すなわち $y=f(x)$ が傾きが正の直線の場合を考えてみる (図 6)。

図 6: 右上がりの直線のような分布
\includegraphics[width=0.5\textwidth ]{hist-line.eps}

この場合、度数は右に行くにつれて増えているので、 $M_e$ は、データ値の中央である $(a+b)/2$ よりも右にある。 式で表すこともでき、ある 2 次方程式の解になることがわかるが、 ここでは省略する。 もちろん、重心も $x=(a+b)/2$ よりも右にあるので、 $M_n$$(a+b)/2$ よりも大きいことがわかる。

一方、この図の $M_e$ より右の部分を、 面積を変えずに左右対称になるように変形しても、 $M_e$ の位置は変わらない (図 7)。

図 7: 左右対称に変形
\includegraphics[width=0.5\textwidth ]{hist-mod.eps}

しかし、元の右上がりの直線図形と、この左右対称な図形では、 元の図形の方が移動した部分は $M_e$ の近くにあるので、 図形の重心は元の図形の方が左側にある。 左右対称な図形では重心は $x=M_e$ 上にあるので、 よって元の図形の重心は $x=M_e$ よりも左側にあることになるから、 結局、右上がりの直線の分布に対しては、以下の不等式が成り立つことになる。

\begin{displaymath}
\left(\frac{a+b}{2}<\right)<M_n<M_e\end{displaymath} (8)

この例と同じ考え方を用いれば、逆に直線とは限らない分布で

\begin{displaymath}
M_n<M_e
\end{displaymath}

である場合を考えてみると、 上と同じように $x=M_e$ で左右に分けて、 右側を左右対称な形に変形して考えると、 その場合よりも元の分布は重心が左にあることになる。

つまり、そのような左右対称な図よりも、 元の分布は $x=M_e$ の右側の部分 (の重心) が $x=M_e$ に近い方にある、 ということが言える。 おおざっぱに言えば、$x=M_e$ の右と左では、 右の方が $x=M_e$ の近くにあり、 左の方が遠くにある、ということになる。

しかし、これは「右の分散が左の分散よりも小さい」ことを表すかというと、 必ずしもそうではない。 上の「遠い近い」はあくまで平均、図形でいえば重心のことを意味していて、 いわゆる「1 次モーメントの意味で」ということになるが、 分散とは「2 次モーメント量」であるからである。 1 次モーメントの大小と 2 次モーメントの大小とは一般には関係がない。

竹野茂治@新潟工科大学
2011年3月18日