スポンサーリンク

1次元正規変数の平方和の分布

自然科学
5
(1)

定理

\(\mathcal{N}(0,\sigma)\) に独立に従う \(N\) 個の確率変数 \(x_1,x_2,\cdots,x_N\) と定数 \(a>0\) により定義される確率変数

$$u \equiv a(x_1^2+x_2^2+\cdots+x_N^2)$$

は、自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) に従う。

前提

確率変数 \(u\) についての、自由度 \(k\) 、スケール因子 \(s\) のカイ二乗分布 \(\chi^2(u|k,s)\) は、以下のように定義される。

$$\chi^2(u|k,s) \equiv \frac{1}{2s\Gamma(\frac{k}{2})}(\frac{u}{2s})^{(\frac{k}{2})-1}\exp(-\frac{u}{2s})$$

ここで、 \(\Gamma\) はガンマ関数を表し、確率変数 \(z\) についてのガンマ関数 \(\Gamma(z)\) は以下のように定義される。

$$\Gamma(z) \equiv \int_{0}^{\infty}t^{z-1}e^{-t}dt$$

証明

確率変数の変換に伴う確率密度関数の変換公式

\(M\) 次元の確率変数 \({\bf x}=(x_1,x_2,\cdots,x_M)\) が、 \(z=f({\bf x})=f(x_1,x_2,\cdots,x_M)\) によって \(1\) 次元の確率変数 \(z\) に変換されるとき、 \(z\) の確率密度関数 \(q(z)\) は、 \({\bf x}\) の確率密度関数 \(p(x_1,x_2,\cdots,x_M)\) を用いて以下のように表される。

$$q(z)=\int_{R}\delta(z-f(x_1,x_2,\cdots,x_M))p(x_1,x_2,\cdots,x_M)d{\bf x}$$

https://ushitora.net/archives/954

より、 \(u\) の確率密度関数 \(q(u)\) は

$$q(u) = \int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))\prod_{i=1}^{N}\mathcal{N}(x_i|0,\sigma)dx_1dx_2 \cdots dx_N$$

と表せる。平均 \(0\) 、分散 \(\sigma^2\) の正規分布

$$\mathcal{N}(x_i|0,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp(-\frac{1}{2\sigma^2}x_i^2)$$

を代入すると

$$q(u) = \int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))(2\pi\sigma^2)^{-\frac{N}{2}}\exp\{-\frac{1}{2\sigma^2}(x_1^2+x_2^2+\cdots+x_N^2)\}dx_1dx_2 \cdots dx_N$$

となる。ここで、 \(N\) 次元球座標への変数変換を行うと、動径座標を \(r\) としたとき

$$r^{2}=x_1^2+x_2^2+\cdots+x_N^2$$

とできるので、被積分関数を \(r\) のみに依存する関数として扱うことができる。 \(N\) 次元空間における単位球表面の面素を \(dS_{1,N}\) とおくと、この変換においては

$$dx_1dx_2 \cdots dx_N=r^{N-1}drdS_{1,N}$$

https://ushitora.net/archives/1005

が成り立つので

$$q(u) = \int_{R}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)drdS_{1,N}$$

として、変数変換が実行できる(ただし、 \(R\) は適当な積分区間を表す)。ここで、被積分関数が \(r\) のみに依存することから \(S_{1,N}\) についての積分を別に行うことができ、さらに \(r\) の積分区間が \([0,\infty)\) となることを考慮すると

$$q(u) = \int_{0}^{\infty}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)dr \int dS_{1,N}$$

となり、さらに

$$v=ar^2$$

とおいて

$$dv=2ar\,dr=2a\sqrt{\frac{v}{a}}\,dr$$

より、もう一度 \(r\) から \(v\) への変数変換を行うと

$$q(u) = \int_{0}^{\infty}\frac{1}{2a}(\frac{v}{a})^{\frac{N-1}{2}}\cdot(\frac{v}{a})^{-\frac{1}{2}}\delta(u-v)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}\cdot\frac{v}{a})dv \int dS_{1,N}$$
$$= \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}\int_{0}^{\infty}\delta(u-v)(\frac{v}{a})^{\frac{N}{2}-1}\exp(-\frac{v}{2a\sigma^2})dv \int dS_{1,N}$$

となる。この積分を行うには、ディラックのデルタ関数の性質

$$\int_{-\infty}^{\infty}f(x)\delta(x-a)dx=f(a)$$
$$\delta(-x)=\delta(x)$$

https://ushitora.net/archives/897

と、 \(N\) 次元空間における単位球表面の面素と表面積の関係

$$S_{1,M} \equiv \int dS_{1,M} = \frac{2\pi^{\frac{M}{2}}}{\Gamma(\frac{M}{2})}$$

https://ushitora.net/archives/1005

を用いる。これらを適用すると

$$q(u) = \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}(\frac{u}{a})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})\frac{2\pi^{\frac{N}{2}}}{\Gamma(\frac{N}{2})}$$
$$= \frac{1}{2a\sigma^2\Gamma(\frac{N}{2})}(\frac{u}{a\sigma^2})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})$$

が導かれ、 \(u\) の確率密度関数は自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) になることがわかる。

この記事は役に立ちましたか?

星をクリックして、評価してください!

現在の平均評価 5 / 5. 評価した人数: 1

お役に立てたようで嬉しいです!

著者SNSをフォローしていただけると、更新情報が手に入ります。

記事がご期待に沿えなかったようで、申し訳ありません…。

是非、改善点を教えてください!

この記事において改善すべき点や、追加で知りたかったことは何ですか?

コメント