何らかの 2 次元的なデータ ( ) があるとし、 これに対して、 の平均、 の平均を , と書く。
(1)
まず、 の最小値を考えるために、
, に関する の停留点を求める。偏微分
(4)
ここで、 となるのは、すべての が に等しい、 つまりすべての が同じ値である場合であるから、 そうでなければ となる。 よって、通常のデータでは、 と考えることができ、 以下その状況で考える。
なお、ついでに言うと、(4) の の計算も、 最初から より の定義式 (1) を 用いて計算している学生を見かけることがあるが、 むしろ (4) の最初にある による表現式を用いて 計算する方が楽である。 それは、 の定義を用いると、 、 を先に求めるためにまず全部のデータを一度走査する必要があり、 その後でもう一度全部のデータを走査する必要があるが、 の値ならば、 各データに対する , , , の値の和を 計算していけばいいだけなので、データの走査は一度で済む。 つまり大量のデータに対しても、 こちらの方法を使えば逐次計算していくことができる。
竹野茂治@新潟工科大学