2 命題と簡略化

証明すべき事柄は以下の通りである。


命題 1

確率変数 $x_1,\ldots,x_n$ が独立で、 $x_j\sim N(\mu_j,\sigma_j^2)$ ($1\leq j\leq n$) であるとき、定数 $a_j\ (\neq 0)$, $b$ に対し、

  $\displaystyle
y=\sum_{j=1}^n a_jx_j+b \sim N\left(\sum_{j=1}^n a_j\mu_j+b,
\sum_{j=1}^na_j^2\sigma_j^2\right)
$ (1)


これをいくつかの段階に分けて考える。


命題 2

確率変数 $x_1,\ldots,x_n$ が独立で、関数 $\phi_j$ により $y_j=\phi_j(x_j)$ というあらたな確率変数が作られるとき、 $y_1,\ldots,y_n$ も ( $(x_1,\ldots,x_n)$$n$ 次元確率分布の 元で) 独立となる。


この命題の「あらたな確率変数が作られるとき」という表現については、 連続確率変数の場合は任意の関数であらたな連続確率変数が 作られるとは限らないために用いている。 例えば、$\phi_j(x)$$x$ の 1 次式、多項式などであれば問題はない。 詳しくは、[1] を参照のこと。

また、「 $(x_1,\ldots,x_n)$$n$ 次元確率分布の元で」という 表現については、「 $y_1,\ldots,y_n$」の独立性は本来 $(y_1,\ldots,y_n)$ に関する $n$ 次元確率分布のとり方によって 決まることであるが、 それを「 $(y_1,\ldots,y_n)$$n$ 次元確率分布を $(x_1,\ldots,x_n)$$n$ 次元確率分布から自然に決まるものとする」、 すなわち、

$\displaystyle {\mathrm{Prob}\{(y_1,\ldots,y_n)\in B_1\times\cdots\times B_n\}}$
  $\textstyle =$ $\displaystyle \mathrm{Prob}\{(x_1,\ldots,x_n)\in \phi_1^{-1}(B_1)\times\cdots
\times \phi_n^{-1}(B_n)\}$ (2)
とする場合にこの命題が成り立つ、ということを意味する。 $n$ 次元確率分布とその独立性については、 詳しくは、[1] を参照のこと。

命題 [*] の証明

$y_1,\ldots,y_n$ が独立であることは、任意の $B_j$ に対し

  $\displaystyle
\mathrm{Prob}\{(y_1,\ldots,y_n)\in B_1\times\cdots\times B_n\}
=\mathrm{Prob}\{y_1\in B_1\}\times\cdots\times\mathrm{Prob}\{y_n\in B_n\}
$ (3)
が成り立つことを意味する。([*])、 および $x_1,\ldots,x_n$ が独立であるという仮定により、 ([*]) の左辺は
\begin{eqnarray*}\lefteqn{
\mathrm{Prob}\{(y_1,\ldots,y_n)\in B_1\times\cdots\t...
...b}\{y_1\in B_1\}\times\cdots
\times\mathrm{Prob}\{y_n\in B_n\}
\end{eqnarray*}
となるので、([*]) が成立する。


命題 [*] の正規分布に従う確率変数 $x_j$ に対して 標準化 $u_j=(x_j-\mu_j)/\sigma_j\sim N(0,1)$ を取れば、 命題 [*] より $u_1,\ldots,u_n$ は独立で、 $y$ は、

  $\displaystyle
y = \sum_{j=1}^n a_jx_j + b = \sum_{j=1}^n a_j\sigma_j u_j + c,
\hspace{1zw}c=\sum_{j=1}^n a_j\mu_j + b$ (4)
となる。


補題 3

$u\sim N(0,1)$ ならば $v=-u\sim N(0,1)$


証明

$N(0,1)$ の密度関数

  $\displaystyle
f_0(u) = \frac{1}{\sqrt{2\pi}}\,e^{-u^2/2}
$ (5)
は偶関数なので、$v$ の分布関数 $\mathrm{Prob}\{v\leq t\}$ は、
\begin{eqnarray*}\mathrm{Prob}\{v\leq t\}
&=&
\mathrm{Prob}\{u\geq -t\}
\ =\ ...
...&
1 - \int_t^{\infty}f_0(u)du
\ =\
\int_{-\infty}^tf_0(u)du
\end{eqnarray*}
となって $N(0,1)$ の分布関数に一致する。


よって、$u_j$ に対して

  $\displaystyle
v_j = \left\{\begin{array}{ll}
u_j & (\mbox{$a_j>0$\ のとき})\\
-u_j & (\mbox{$a_j<0$\ のとき})
\end{array}\right.$ (6)
とすれば、補題 [*] により $v_j\sim N(0,1)$ で、 命題 [*] より $v_1,\ldots,v_n$ も独立であり、 また $a_ju_j=\vert a_j\vert v_j$ となるので、([*]) は、
  $\displaystyle
y = \sum_{j=1}^n d_j v_j + c,
\hspace{1zw}c=\sum_{j=1}^n a_j\mu_j + b,
\hspace{1zw}d_j = \vert a_j\vert\sigma_j > 0$ (7)
と書ける。つまり、命題 [*] を、 $\mu_j=0$, $\sigma_j=1$, $a_j>0$ の形に帰着できることになる。

もしこの ([*]) に対して命題 [*] が 成立することが言えれば、

$\displaystyle y\sim N\left(c,\sum_{j=1}^nd_j^2\right)
= N\left(\sum_{j=1}^n a_j\mu_j + b,\sum_{j=1}^na_j^2\sigma_j^2\right)
$
となり、命題 [*] が得られることがわかる。 よって後は、命題 [*] を、 $\mu_j=0$, $\sigma_j=1$, $a_j>0$ の元で示せばよい。

竹野茂治@新潟工科大学
2022-07-29