定理
\(\mathcal{N}(0,\sigma)\) に独立に従う \(N\) 個の確率変数 \(x_1,x_2,\cdots,x_N\) と定数 \(a>0\) により定義される確率変数
$$u \equiv a(x_1^2+x_2^2+\cdots+x_N^2)$$は、自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) に従う。
前提
確率変数 \(u\) についての、自由度 \(k\) 、スケール因子 \(s\) のカイ二乗分布 \(\chi^2(u|k,s)\) は、以下のように定義される。
$$\chi^2(u|k,s) \equiv \frac{1}{2s\Gamma(\frac{k}{2})}(\frac{u}{2s})^{(\frac{k}{2})-1}\exp(-\frac{u}{2s})$$
ここで、 \(\Gamma\) はガンマ関数を表し、確率変数 \(z\) についてのガンマ関数 \(\Gamma(z)\) は以下のように定義される。
$$\Gamma(z) \equiv \int_{0}^{\infty}t^{z-1}e^{-t}dt$$
証明
確率変数の変換に伴う確率密度関数の変換公式
\(M\) 次元の確率変数 \({\bf x}=(x_1,x_2,\cdots,x_M)\) が、 \(z=f({\bf x})=f(x_1,x_2,\cdots,x_M)\) によって \(1\) 次元の確率変数 \(z\) に変換されるとき、 \(z\) の確率密度関数 \(q(z)\) は、 \({\bf x}\) の確率密度関数 \(p(x_1,x_2,\cdots,x_M)\) を用いて以下のように表される。
$$q(z)=\int_{R}\delta(z-f(x_1,x_2,\cdots,x_M))p(x_1,x_2,\cdots,x_M)d{\bf x}$$https://ushitora.net/archives/954
より、 \(u\) の確率密度関数 \(q(u)\) は
$$q(u) = \int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))\prod_{i=1}^{N}\mathcal{N}(x_i|0,\sigma)dx_1dx_2 \cdots dx_N$$
と表せる。平均 \(0\) 、分散 \(\sigma^2\) の正規分布
$$\mathcal{N}(x_i|0,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp(-\frac{1}{2\sigma^2}x_i^2)$$
を代入すると
$$q(u) = \int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))(2\pi\sigma^2)^{-\frac{N}{2}}\exp\{-\frac{1}{2\sigma^2}(x_1^2+x_2^2+\cdots+x_N^2)\}dx_1dx_2 \cdots dx_N$$
となる。ここで、 \(N\) 次元球座標への変数変換を行うと、動径座標を \(r\) としたとき
$$r^{2}=x_1^2+x_2^2+\cdots+x_N^2$$
とできるので、被積分関数を \(r\) のみに依存する関数として扱うことができる。 \(N\) 次元空間における単位球表面の面素を \(dS_{1,N}\) とおくと、この変換においては
$$dx_1dx_2 \cdots dx_N=r^{N-1}drdS_{1,N}$$https://ushitora.net/archives/1005
が成り立つので
$$q(u) = \int_{R}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)drdS_{1,N}$$
として、変数変換が実行できる(ただし、 \(R\) は適当な積分区間を表す)。ここで、被積分関数が \(r\) のみに依存することから \(S_{1,N}\) についての積分を別に行うことができ、さらに \(r\) の積分区間が \([0,\infty)\) となることを考慮すると
$$q(u) = \int_{0}^{\infty}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)dr \int dS_{1,N}$$
となり、さらに
$$v=ar^2$$
とおいて
$$dv=2ar\,dr=2a\sqrt{\frac{v}{a}}\,dr$$
より、もう一度 \(r\) から \(v\) への変数変換を行うと
$$q(u) = \int_{0}^{\infty}\frac{1}{2a}(\frac{v}{a})^{\frac{N-1}{2}}\cdot(\frac{v}{a})^{-\frac{1}{2}}\delta(u-v)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}\cdot\frac{v}{a})dv \int dS_{1,N}$$
$$= \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}\int_{0}^{\infty}\delta(u-v)(\frac{v}{a})^{\frac{N}{2}-1}\exp(-\frac{v}{2a\sigma^2})dv \int dS_{1,N}$$
となる。この積分を行うには、ディラックのデルタ関数の性質
$$\int_{-\infty}^{\infty}f(x)\delta(x-a)dx=f(a)$$$$\delta(-x)=\delta(x)$$https://ushitora.net/archives/897
と、 \(N\) 次元空間における単位球表面の面素と表面積の関係
$$S_{1,M} \equiv \int dS_{1,M} = \frac{2\pi^{\frac{M}{2}}}{\Gamma(\frac{M}{2})}$$https://ushitora.net/archives/1005
を用いる。これらを適用すると
$$q(u) = \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}(\frac{u}{a})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})\frac{2\pi^{\frac{N}{2}}}{\Gamma(\frac{N}{2})}$$
$$= \frac{1}{2a\sigma^2\Gamma(\frac{N}{2})}(\frac{u}{a\sigma^2})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})$$
が導かれ、 \(u\) の確率密度関数は自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) になることがわかる。
コメント