3 伸び

$x_j$, $y_j$ が 1 回目と 2 回目のテストの点数のように、 同種のデータである場合は、 その差 $z_j=y_j-x_j$ を値の「伸び」として考えることができる。 これが $x_j$ の値と相関があるのか、 すなわち $x_j$ が大きいほど伸びは大きくなるのか、 または $x_j$ がむしろ小さい方が伸びは大きくなるのか、 などを調べたくなることもまた自然であろう。

伸びとしては、$z_j=y_j-x_j$ 以外に、$y_j$$x_j$ での回帰直線の値との差

\begin{displaymath}
w_j = y_j - (\alpha_{xy}(x_j-\bar{x})+\bar{y})\end{displaymath} (8)

を考えることもできる。 回帰直線の値は、$x_j$ に対する平均的な $y$ の値、 期待される $y$ の値を意味し、$w_j$ はそれとの差であり、 よって全体のデータから決まる相対的な伸びを意味することになる。

$x_j$$y_j$ の単位が違う場合には $z_j$ のような差よりも むしろ $w_j$ の方が伸びとしては適切だろうし、 また $w_j$ はスケール変換にも強い。 例えば、$x'_j = px_j$, $y'_j = qy_j$ とすると、

\begin{displaymath}
z'_j = y'_j - x'_j = qy_j - px_j
\end{displaymath}

より $z_j$ の分布とはかなり変わってしまう可能性があるが、 $w'_j$ の方は、

\begin{displaymath}
\bar{x'}=p\bar{x},
\hspace{0.5zw}\bar{y'}=q\bar{y},
\hspace{...
...{0.5zw}S_{y'y'} = q^2S_{yy},
\hspace{0.5zw}S_{x'y'} = pqS_{xy}
\end{displaymath}

より、

\begin{displaymath}
\alpha_{x'y'}
= \frac{S_{x'y'}}{S_{x'x'}}
= \frac{pqS_{xy}}{p^2S_{xx}}
= \frac{q}{p}\alpha_{xy}
\end{displaymath}

となり、$x'$, $y'$ の回帰直線は、

\begin{displaymath}
y' = qy
=
\alpha_{x'y'}(x'-\bar{x'})+\bar{y'}
=
\frac{q}{p...
...xy}(px-p\bar{x})+q\bar{y}
=
q(\alpha_{xy}(x-\bar{x})+\bar{y})
\end{displaymath}

となり、実質的に (6) と同じものになり、

\begin{displaymath}
w'_j
= y'_j - (\alpha_{x'y'}(x'_j-\bar{x'})+\bar{y'})
= qy_j...
...t(\frac{q}{p}\alpha_{xy}(px_j-p\bar{x})+q\bar{y}\right)
= qw_j
\end{displaymath}

となって、$w_j$ の分布を $q$ 倍しただけなので、 実質的に分布は変わらず、スケール変換に影響されないことがわかる。

竹野茂治@新潟工科大学
2019-06-05