5 連続分布のたたみこみ

前節で、ポアソン分布の裏が指数分布であることを示したが、 そこにも述べたように教科書 [3] には、 実は「指数分布の裏がポアソン分布」と書いてある。 次はそれを考えるために、まずは連続分布のたたみこみについて説明する。

本稿では、連続確率分布 $P$ を、標本空間 $\mbox{\boldmath R}$ と、 分布関数 $F(x)$ をセットにして、 $P=(\mbox{\boldmath R},F)$ のように表す。 密度関数 $f(x)$$f(x)=F'(x)$ である。

この場合も、独立な確率変数の和の分布で考える。 $x\sim P=(\mbox{\boldmath R},F)$, $y\sim Q=(\mbox{\boldmath R},G)$ のとき、$x,y$ を独立として 考えた 2 次元確率変数 $(x,y)$ の分布関数は $H(x,y)=F(x)G(y)$ で、 密度関数は $h(x,y)=f(x)g(y)$ となる ($f=F'$, $g=G'$)。 よって、$z=x+y$ は、以下の $K(z)$ を分布関数とする確率変数となる。

$\displaystyle K(t)$ $\textstyle =$ $\displaystyle \mathrm{Prob}\{x+y\leq t\}
\ =\
\int\!\!\int _{\{x+y\leq t\}}h(x,y)dxdy$  
  $\textstyle =$ $\displaystyle \int_{\mbox{\boldmath\scriptsize R}}dx\int_{-\infty}^{t-x}f(x)g(y)dy
\ =\
\int_{\mbox{\boldmath\scriptsize R}}f(x)G(t-x)dx$ (4)
よって、$z$ の密度関数は、これを $t$ で微分した
  $\displaystyle
k(t)=K'(t) = \int_{\mbox{\boldmath\scriptsize R}}f(x)g(t-x)dx$ (5)
となる。 逆に、 $P=(\mbox{\boldmath R},F)$, $Q=(\mbox{\boldmath R},G)$ から (5) によって 作った $k(t)$ ($=(f\ast g)(t)$ と書く) を密度関数とするような 連続確率分布を、$P$$Q$ の「たたみこみ」と呼び、$P\ast Q$ と書く。

なお、$f\geq 0$, $g \geq 0$ $f,g\in L^1(\mbox{\boldmath R})$ なので $f\ast g\geq 0$ で、

\begin{eqnarray*}\int_{\mbox{\boldmath\scriptsize R}}(f\ast g)(t)dt
&=&
\int_...
...ize R}}f(x)dx\int_{\mbox{\boldmath\scriptsize R}}g(y)dy
\ =\
1\end{eqnarray*}
となるので、確かに $f\ast g$ はある連続分布の密度関数となる。

また、(4) より、 $P\ast Q = (\mbox{\boldmath R},f\ast G)$ となるが、 これは次の命題 5 により $P\ast Q = (\mbox{\boldmath R},F\ast g)$ とも書ける。


命題 5

  1. $f\ast g = g\ast f$
  2. $(f\ast g)\ast h = f\ast(g\ast h)$


証明

1.

$\displaystyle (f\ast g)(t) = \int_{\mbox{\boldmath\scriptsize R}}f(x)g(t-x)dx
= \int_{\mbox{\boldmath\scriptsize R}}f(t-y)g(y)dx = (g\ast f)(t)
$
より O.K.

2.

\begin{eqnarray*}\lefteqn{((f\ast g)\ast h)(t)
\ =\
\int_{\mbox{\boldmath\sc...
...\scriptsize R}}f(y)(g\ast h)(t-y)dy
\ =\
(f\ast(g\ast h))(t)
\end{eqnarray*}
より O.K.


この命題 5 より、離散の場合同様、 $x_i\sim P_i=(\mbox{\boldmath R},F_i)$ ($1\leq i\leq n$) に対するたたみこみ $P_1\ast\cdots\ast P_n$ を考えることもできる。

\begin{eqnarray*}\lefteqn{
(f_1\ast\cdots\ast f_n)(t)
\ =\
\int_{\mbox{\bold...
...criptsize R}}f_{n-1}(x_{n-1})
f_n(t-x_1-\cdots-x_{n-1})d x_{n-1}\end{eqnarray*}
なので、$t$ に関して $-\infty$ から $y$ まで積分すると、
\begin{eqnarray*}\lefteqn{
\int_{-\infty}^y(f_1\ast\cdots\ast f_n)(t)dt
}
\\ ...
...x_1+\cdots+x_n\leq y\}}f_1(x_1)\cdots f_n(x_n)d\overrightarrow{x}\end{eqnarray*}
となり、これは、 $x_1,\ldots,x_n$ を独立と見た場合の $z=x_1+\ldots+x_n$ の分布関数にほかならない。よって、 $f_1\ast\cdots\ast f_n$ はその $z$ の密度関数となる。

離散の場合と同様に、$P_j$ がすべて $P=(\mbox{\boldmath Z${}_{+}$},F)$ に等しい場合、 本稿では $P$$n$ 重のたたみこみを $P^{(n)}=(\mbox{\boldmath Z${}_{+}$},F^{(n)})$ と書く。 $n$ 階導関数ではないので注意すること。


6

正規分布 $N(\mu,\sigma^2)$ のたたみこみを計算する。 正規分布 $N(\mu,\sigma^2)$ の密度関数を、

$\displaystyle f_{\mu,\sigma}(x) = \frac{1}{\sqrt{2\pi}\,\sigma}e^{-(x-\mu)^2/(2\sigma^2)}
$
とする。このとき、
$\displaystyle (f_{\mu_1,\sigma_1}\ast f_{\mu_2,\sigma_2})(t)
=\frac{1}{2\pi\si...
...\scriptsize R}}e^{-(x-\mu_1)^2/(2\sigma_1^2)
-(t-x-\mu_2)^2/(2\sigma_2^2)}dx
$
となるが、$x-\mu_1=y$, $t-x-\mu_2=t-\mu_1-\mu_2-y=a-y$ とすると、
\begin{eqnarray*}\lefteqn{
\frac{(x-\mu_1)^2}{\sigma_1^2}+\frac{(t-x-\mu_2)^2}{...
...ma_1^2+\sigma_2^2}\right)^2
+\frac{a^2}{\sigma_1^2+\sigma_2^2}
\end{eqnarray*}
となるので、$b>0$ に対し、
$\displaystyle \int_{\mbox{\boldmath\scriptsize R}}e^{-bx^2/2}dx
= \int_{\mbox{\boldmath\scriptsize R}}e^{-t^2}dt\sqrt{\frac{2}{b}}
= \sqrt{\frac{2\pi}{b}}
$
より、
\begin{eqnarray*}\lefteqn{(f_{\mu_1,\sigma_1}\ast f_{\mu_2,\sigma_2})(t)
\ =\
...
..._2^2))}
\ =\
f_{\mu_1+\mu_2,\sqrt{\sigma_1^2+\sigma_2^2}}(t)
\end{eqnarray*}
となる。よって、
$\displaystyle N(\mu_1,\sigma_1^2)\ast N(\mu_2,\sigma_2^2)
=N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)
$
がわかる。左辺は、$x_1+x_2$ の分布であるから、 これは丁度 [2] の考察に対応する。



7

指数分布 $e(1/\lambda)$ のたたみこみを計算する。 $e(1/\lambda)$ の密度関数 $f_{\lambda}$ は (3) の 形なので、$z<0$ なら $(f_\lambda\ast f_\mu)(z) = 0$ であり、 $z>0$ なら

\begin{eqnarray*}(f_\lambda\ast f_\mu)(z)
&=&
\int_0^zf_\lambda(t)f_\mu(z-t)dt...
...dt
\\ &=&
\lambda\mu e^{-\mu z}\int_0^z e^{(\mu-\lambda) t}dt
\end{eqnarray*}
より、$\lambda = \mu$ なら
$\displaystyle (f_\lambda\ast f_\lambda)(z) = f_\lambda^{(2)}(z)
= \lambda^2 z e^{-\lambda z}\hspace{1zw}(z>0)
$
となり、 $\lambda\neq\mu$ なら
$\displaystyle (f_\lambda\ast f_\mu)(z)
= \lambda\mu e^{-\mu z}
\left[\frac{e...
...\frac{\lambda\mu}{\mu-\lambda} (e^{-\lambda z}-e^{-\mu z})
\hspace{1zw}(z>0)
$
となる。よって、
$\displaystyle (f_\lambda\ast f_\mu)(z)
= \left\{\begin{array}{ll}
\displaysty...
...}-e^{-\mu z}}{\mu-\lambda}\chi_{+}(z)
& (\lambda\neq \mu)
\end{array}\right. $
となる。ここで、$\chi_{+}(z)$ は、$z>0$ では 1、$z<0$ では 0 となる 関数とする。 これらはいずれも指数分布とは別の分布となる。

$f_\lambda^{(n)}$ については、

  $\displaystyle
f_\lambda^{(n)}(z) = \lambda^n\frac{z^{n-1}}{(n-1)!}e^{-\lambda z}
\chi_{+}(z)
$ (6)
となることを示す。$n=1,2$ については上の結果より成立する。 $n-1$ まで成り立つとすると ($n\geq 2$)、$z>0$ に対し、
\begin{eqnarray*}f_\lambda^{(n)}(z)
&=&
(f_\lambda^{(n-1)}\ast f_\lambda)(z)
...
...-1}}{n-1}
\ =\
\lambda^n\frac{z^{n-1}}{(n-1)!}e^{-\lambda z}
\end{eqnarray*}
となって $n$ でも成立する。 ちなみに、
\begin{eqnarray*}\int_{\mbox{\boldmath\scriptsize R}}f_\lambda^{(n)}(z)dz
&=&
...
...hop{\mathit{\Gamma}}(n)
\ =\
\frac{(n-1)!}{(n-1)!}
\ =\
1
\end{eqnarray*}
となり、 $f_\lambda^{(n)}$ が確かにある分布の密度関数であることがわかるが、 これを密度関数として持つ分布はガンマ分布 $\mathop{\mathit{\Gamma}}(n,1/\lambda)$ と呼ばれる。 よって、 $e(1/\lambda)^{(n)}=\mathop{\mathit{\Gamma}}(n,1/\lambda)$ となる。


竹野茂治@新潟工科大学
2022-08-25