2 レーダーチャートの面積

レーダーチャートは、前節でも説明したように、 $n$ 個の項目に対する $n$ 個のデータ $p_1,p_2,\ldots,p_n$ を、 正 $n$ 角形の中心から各頂点に向かう線分を軸として その上に値を取り、隣接する軸上のデータ同士を線分で結んで 多角形としたものである (図 1)。

通常は、各項目の平均値などの標準的な多角形と比較することで 弱い点や強い点などのデータの性質を見いだしたり、 多角形の形などから典型的な状態に分類したりするのに用いられる。

この多角形の面積を見るというのは、 多分面積が大きければ総合的に点数がいい、評価が高い、 ということを意味し、面積が小さければ点数が悪い、評価が低い、 ということを意味すると考える、ということだと思うが、 それは正しいだろうか。

実は、レーダーチャートが囲む多角形の面積は、 軸のスケールの選び方や軸の位置の選び方で同じデータでも値は変わるし、 違う種類の 2 種類のデータでは異なる方向に変化してしまうので、 その面積を指標に用いることは一般的にはできない。 それらを以下で簡単に説明する。

まずこの多角形の面積を式で表わしてみる。

各軸の最大を意味する場所までの中心からのグラフ上の距離 (= 最も外側の正多角形の外接円の半径) を $R$ とし、 $k$ 番目の軸の $R$ の場所が表わす値 (最大値) を $M_k$ とする。 $k$ 番目の軸に対するデータ値を $p_k$ とすれば、 グラフ上での中心からの $p_k$ までの距離は $Rp_k/M_k$ であり、 その点と、隣りの $k-1$ 番目のデータの軸上の点と中心の 3 点が作る 三角形の面積は、中心角が $2\pi/n$ より

\begin{displaymath}
\frac{1}{2} \frac{Rp_{k-1}}{M_{k-1}}\frac{Rp_k}{M_k}\sin\frac{2\pi}{n}\end{displaymath} (1)

となるので、レーダーチャート全体の多角形の面積は、
\begin{displaymath}
S_0 = \frac{R^2}{2}\sin\frac{2\pi}{n}
\sum_{k=1}^n\frac{p_{k-1}p_k}{M_{k-1}M_k}\end{displaymath} (2)

となる。ただし、$p_0=p_n$, $M_0=M_n$ とする。

(2) の $(R^2/2)\sin(2\pi/n)$ の部分は データや軸の最大値の取り方にはよらない定数なので、 残りの部分のみを考える。

\begin{displaymath}
S_1 = \sum_{k=1}^n\frac{p_{k-1}p_k}{M_{k-1}M_k}\end{displaymath} (3)

例えば図 1 の各項目が各教科のテストの点数の場合のように、 各軸のデータの種類 (単位) が同じであるときは $M_k$ の値は すべて同じ値と取ることも多い。

\begin{displaymath}
M_1=M_2=\cdots=M_n = M
\end{displaymath}

この場合は
\begin{displaymath}
S_1 = \frac{1}{M^2}\sum_{k=1}^n p_{k-1}p_k
\end{displaymath}

なので、スケール値 $M$ の値を変えても全体が定数倍されるだけなので、 問題は起こらない。 しかし例えば各項目が個人の体力データで、 ある軸は握力値、ある軸は垂直跳び、ある軸は背筋力などの場合は、 $M_k$ の値は必ずしも共通ではなく、 軸毎に単位や最大値 $M_k$ の選び方は変わってくる。

通常は、$M_k$ はデータが $R$ におさまるような大きな値を取るわけであるが、 ある $j$ 番目の軸の $M_j$ のみ 2 倍の値に変更すると、 (3) の $S_1$ ではその $j$ 軸の両隣の値との積

\begin{displaymath}
\frac{p_{j-1}p_j}{M_{j-1}M_j} + \frac{p_jp_{j+1}}{M_jM_{j+1}...
...\left(\frac{p_{j-1}}{M_{j-1}} + \frac{p_{j+1}}{M_{j+1}}\right)
\end{displaymath}

の値にのみ影響がでて、その値が半分になる。 つまり、$(j-1)$ 番目の軸の値、および $(j+1)$ 番目の軸の値によって、 影響が強く出る場合と、影響が弱く出る場合があり、 これはすべてのデータで共通に変化せず、データ毎に異なる形で変化が現れる。 そして、その影響の出方は、軸の並び方にも強く依存することがわかる。

スケールを変えずに単に軸の並び方を変えるだけでも面積は変化する。 例えば極端な例をあげれば、$n=4$$p_1=M_1$, $p_2=M_2$, $p_3=p_4=0$ である場合は、 レーダーチャートは直角三角形になり $S_1=1/2$ となるが、 2 番目の軸と 3 番目の軸を交換すれば、 $p_1=M_1$, $p_3=M_3$, $p_2=p_4=0$ となり、これは $S_1=0$ となる。 一方、$p_2=M_2$, $p_3=M_3$, $p_1=p_4=0$ というデータに対しては、 その軸の交換によって面積は変わらない。

すなわち、レーダーチャートの面積は、軸を並べかえるだけで変わってしまい、 それもデータによって影響の出方には違いがある。 このようにレーダーチャートの面積には不変性がなく、 一般的には指標に用いるのは問題がある。

逆に、レーダーチャートの面積を指標として使えば、 恣意的にあるデータを良く見せ、あるデータは悪く見せるために 軸の並び方を入れかえ、 一方のレーダーチャートの面積が大きく、 他方は小さくなるようにする、ということすらできてしまうわけである。

竹野茂治@新潟工科大学
2017年2月9日