next up previous
Next: この文書について... Up: 相関係数に関する一考察 Previous: 6 スケール変換に対する不変性 (PDF ファイル: corel1.pdf)


7 最後に

4, 6 節等で調べた不変性と $r,\hat{r},a,\hat{a}$ との関係を表にまとめると 表 1 のようになる。

表 1: データのスケール変換や回転等に関する不変性
  $r$ $\hat{r}$ $a$ $\hat{a}$
$x$,$y$ の入れ替え 不変 不変 本質的に変化 本質的に不変
回転 変化 不変 本質的に変化 本質的に不変
スケール変換 不変 変化 本質的に不変 本質的に変化


例えば $x$$y$ が身長と体重のように全く異なる種類のデータの場合、 各軸の単位の取り方は任意であるため、 各軸毎のスケール変換に関する不変性は、指標としては必須の条件となる。 $\hat{a}$, $\hat{r}$ がその性質を満たさないということは、 これらは異種のデータには弱い、あるいは全く使えない、 ということを意味している。

元々回帰直線は、$y$ 方向に誤差を計るということからもわかるように、 通常の回帰直線は $x$ を変数とみて、$y$ をそれによる関数とみる、 という関係を強く意識していて、よってそれぞれが同種のデータである必要はない。 そういう場合には通常の回帰直線、通常の相関係数を使うべきであろうし、 それで普段は通常の回帰直線が用いられているのだろうと思う。 これが問題 3 の後半部分の回答になると思う。

ただし、単位が同じ同種のデータの直線相関性を調べる場合は、 新たに提案した相関係数、回帰直線も 5 節で述べたように それなりの性質を持つ。 それぞれの優位性を知り、うまく使い分けると良いのではないかと思う。

なお、5 節で提案した新たな回帰直線は、 多変量解析で主成分分析と呼ばれるものに対応しているようである。 主成分分析については、また機会があればまとめたいと思うが、 詳しくは多変量解析の専門書を参照されたい。


next up previous
Next: この文書について... Up: 相関係数に関する一考察 Previous: 6 スケール変換に対する不変性
Shigeharu TAKENO
2004年 10月 18日