1次元正規変数の平方和の分布 | USHITORA Lab.
スポンサーリンク

1次元正規変数の平方和の分布

数学

定理

\(\mathcal{N}(0,\sigma)\) に独立に従う \(N\) 個の確率変数 \(x_1,x_2,\cdots,x_N\) と定数 \(a>0\) により定義される確率変数

$$u \equiv a(x_1^2+x_2^2+\cdots+x_N^2)$$

は、自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) に従う。

前提

確率変数 \(u\) についての、自由度 \(k\) 、スケール因子 \(s\) のカイ二乗分布 \(\chi^2(u|k,s)\) は、以下のように定義される。

$$\chi^2(u|k,s) \equiv \frac{1}{2s\Gamma(\frac{k}{2})}(\frac{u}{2s})^{(\frac{k}{2})-1}\exp(-\frac{u}{2s})$$

ここで、 \(\Gamma\) はガンマ関数を表し、確率変数 \(z\) についてのガンマ関数 \(\Gamma(z)\) は以下のように定義される。

$$\Gamma(z) \equiv \int_{0}^{\infty}t^{z-1}e^{-t}dt$$

証明

確率変数の変換に伴う確率密度関数の変換公式

\(M\) 次元の確率変数 \({\bf x}=(x_1,x_2,\cdots,x_M)\) が、 \(z=f({\bf x})=f(x_1,x_2,\cdots,x_M)\) によって \(1\) 次元の確率変数 \(z\) に変換されるとき、 \(z\) の確率密度関数 \(q(z)\) は、 \({\bf x}\) の確率密度関数 \(p(x_1,x_2,\cdots,x_M)\) を用いて以下のように表される。

$$q(z)=\int_{R}\delta(z-f(x_1,x_2,\cdots,x_M))p(x_1,x_2,\cdots,x_M)d{\bf x}$$

確率変数の変換に伴う確率密度関数の変換公式
確率密度関数は積分の形で与えられるため、置換積分の考え方を応用することで、確率変数を変更したときの新しい確率密度関数を求めることができる。この記事では、そのような確率密度関数の変換公式について考える。逆変換が一意...

より、 \(u\) の確率密度関数 \(q(u)\) は

$$q(u) = \int_{\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))\prod_{i=1}^{N}\mathcal{N}(x_i|0,\sigma)dx_1dx_2 \cdots dx_N$$

と表せる。平均 \(0\) 、分散 \(\sigma^2\) の正規分布

$$\mathcal{N}(x_i|0,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp(-\frac{1}{2\sigma^2}x_i^2)$$

を代入すると

$$q(u) = \int_{\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))(2\pi\sigma^2)^{-\frac{N}{2}}\exp\{-\frac{1}{2\sigma^2}(x_1^2+x_2^2+\cdots+x_N^2)\}dx_1dx_2 \cdots dx_N$$

となる。ここで、 \(N\) 次元球座標への変数変換を行うと、動径座標を \(r\) としたとき

$$r=x_1^2+x_2^2+\cdots+x_N^2$$

とできるので、被積分関数を \(r\) のみに依存する関数として扱うことができる。 \(N\) 次元空間における単位球表面の面素を \(dS_{1,N}\) とおくと、この変換においては

$$dx_1dx_2 \cdots dx_N=r^{N-1}drdS_{1,N}$$

標準正規分布の規格化条件から、M次元単位球の表面積を求める
正規分布$$\mathcal{N}(x|\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\{-\frac{1}{2\sigma^2}(x-\mu)\}$$は様々な特徴...

が成り立つので

$$q(u) = \int_{R}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)drdS_{1,N}$$

として、変数変換が実行できる(ただし、 \(R\) は適当な積分区間を表す)。ここで、被積分関数が \(r\) のみに依存することから \(S_{1,N}\) についての積分を別に行うことができ、さらに \(r\) の積分区間が \([0,\infty)\) となることを考慮すると

$$q(u) = \int_{0}^{\infty}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)dr \int dS_{1,N}$$

となり、さらに

$$v=ar^2$$

とおいて

$$dv=2ar\,dr=2a\sqrt{\frac{v}{a}}\,dr$$

より、もう一度 \(r\) から \(v\) への変数変換を行うと

$$q(u) = \int_{0}^{\infty}\frac{1}{2a}(\frac{v}{a})^{\frac{N-1}{2}}\cdot(\frac{v}{a})^{-\frac{1}{2}}\delta(u-v)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}\cdot\frac{v}{a})dv \int dS_{1,N}$$

$$= \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}\int_{0}^{\infty}\delta(u-v)(\frac{v}{a})^{\frac{N}{2}-1}\exp(-\frac{v}{2a\sigma^2})dv \int dS_{1,N}$$

となる。この積分を行うには、ディラックのデルタ関数の性質

$$\int_{-\infty}^{\infty}f(x)\delta(x-a)dx=f(a)$$

$$\delta(-x)=\delta(x)$$

クロネッカーのデルタとディラックのデルタ関数
クロネッカーのデルタは、条件分岐を数式上で表現できる非常に便利な関数である。例えば、A = c = sum( if a == 1 else 0 for a in A])print(c) # 7 = 0 + 2 +...

と、 \(N\) 次元空間における単位球表面の面素と表面積の関係

$$S_{1,M} \equiv \int dS_{1,M} = \frac{2\pi^{\frac{M}{2}}}{\Gamma(\frac{M}{2})}$$

標準正規分布の規格化条件から、M次元単位球の表面積を求める
正規分布$$\mathcal{N}(x|\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\{-\frac{1}{2\sigma^2}(x-\mu)\}$$は様々な特徴...

を用いる。これらを適用すると

$$q(u) = \frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}(\frac{u}{a})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})\frac{2\pi^{\frac{N}{2}}}{\Gamma(\frac{N}{2})}$$

$$= \frac{1}{2a\sigma^2\Gamma(\frac{N}{2})}(\frac{u}{a\sigma^2})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})$$

が導かれ、 \(u\) の確率密度関数は自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) になることがわかる。

コメント