概要
ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。
この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。
二項分布
確率 \(p\) で成功する試行を \(n\) 回実施したとき、成功回数 \(x\) は、二項分布
$$\binom{n}{x}p^x(1-p)^{n-x}$$
にしたがう。ここで、 \(\binom{n}{x}\) は二項係数である。
このとき、成功回数の期待値 \(\mathbb{E}[x]\) は \(np\) となる。
ポワソン分布の導出
成功回数が二項分布にしたがう事象について、試行を無限回行うことを考える。 \((n\to\infty)\)
ただし、試行回数が無限回となっても、期待値は一定 \(np=\lambda\) とする。
\(p=\frac{\lambda}{n}\) を代入して極限をとると
$$\lim_{n\to\infty}\binom{n}{x}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}=\lim_{n\to\infty}\frac{n!}{(n-x)!x!}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}$$
$$=\lim_{n\to\infty}\frac{n!}{(n-x)!n^x}\times\frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^{n-x}$$
$$=\lim_{n\to\infty}\frac{n(n-1)\cdots(n-x+1)}{n^x}\times\frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^{n-x}$$
$$=\lim_{n\to\infty}\frac{n}{n}\frac{n-1}{n}\cdots\frac{n-x+1}{n}\times\frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^{n-x}$$
ここで、乗算記号の左側の分数は全部で \(x\) 個あり、それぞれについて
$$\frac{n-i}{n}=\frac{1-\frac{i}{n}}{1}\to1$$
が成り立つ。ネイピア数と極限の関係
$$\lim_{n\to\infty}\left(1+\frac{a}{n}\right)^{n}=e^a$$
と合わせて
$$\lim_{n\to\infty}\binom{n}{x}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{n-x}=\frac{\lambda^x}{x!}e^{-\lambda}$$
となり、ポワソン分布が導出される。
ポワソン分布の意味
導出の際の設定を再考することで、ポワソン分布の意味が見えてくる。
ポワソン分布は、二項分布の試行回数 \(n\) を無限大とした際の極限として導かれるが、このとき、成功回数の期待値 \(np\) が一定であるとした。
すなわち、試行回数が無限となっても成功する回数はせいぜい数回という、非常にまれな事象について考えていることがわかる。
そして、この期待値がそのままポワソン分布の期待値パラメータ \(\lambda\) となっている。
すなわち、ポワソン分布は、とある時間間隔の内に(仮想的に)無限回の試行を行ったときの成功回数の分布、言い換えると、上限を無限とした稀な事象の生起回数の分布とみなすことができる。
(補足)ポワソン過程
\(\lambda\) は単位時間あたりの平均生起回数とみなすことができ、到着率と呼ばれる。
\(N_t\) を時刻 \(t\) より前に事象が生起した回数とすると、
$$P(N_t=k)=\frac{(\lambda t)^k}{k!}e^{-\lambda t}$$
となる。この関係をみたす時系列の確率過程をポワソン過程と呼ぶ。
コメント