1次元正規変数の平方和がしたがう分布【カイ二乗分布】の導出

確率・統計
スポンサーリンク

独立の正規分布にしたがう確率変数を複数用意し、それらを2乗して足し合わせて新たな確率変数を作ったとき、その変数はカイ二乗分布にしたがう。

この記事では、確率変数の変換にともなう確率密度関数の変換公式を出発点にして、平方和とカイ二乗分布の関係を導出する

定理

正規分布 \(\mathcal{N}(0,\sigma)\) に独立にしたがう \(N\) 個の確率変数 \(x_1,x_2,\cdots,x_N\) と定数 \(a> 0\) により定義される、新たな確率変数

$$u \equiv a(x_1^2+x_2^2+\cdots+x_N^2)$$

は、自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) にしたがう。

証明

前提となる知識(カイ二乗分布)

確率変数 \(u\) についての、自由度 \(k\) 、スケール因子 \(s\) のカイ二乗分布 \(\chi^2(u|k,s)\) は、以下のように定義される。

$$\chi^2(u|k,s)\equiv\frac{1}{2s\Gamma(\frac{k}{2})}(\frac{u}{2s})^{\frac{k}{2}-1}\exp(-\frac{u}{2s})$$

ここで、 \(\Gamma\) はガンマ関数を表し、確率変数 \(z\) についてのガンマ関数 \(\Gamma(z)\) は以下のように定義される。

$$\Gamma(z)\equiv\int_{0}^{\infty}t^{z-1}e^{-t}dt$$

確率変数の変換

確率変数の変換に伴う確率密度関数の変換公式

\(M\) 次元の確率変数 \({\bf x}=(x_1,x_2,\cdots,x_M)\) が、 \(z=f({\bf x})=f(x_1,x_2,\cdots,x_M)\) によって \(1\) 次元の確率変数 \(z\) に変換されるとき、

\(z\) の確率密度関数 \(q(z)\) は、 \({\bf x}\) の確率密度関数 \(p(x_1,x_2,\cdots,x_M)\) を用いて以下のように表される。

$$q(z)=\int_{R}\delta(z-f(x_1,x_2,\cdots,x_M))p(x_1,x_2,\cdots,x_M)d{\bf x}$$

確率変数の変換に伴う確率密度関数の変換公式
この記事の簡略版線形変換\(Y=aX+b\)の場合の簡略版はこちら。概要確率密度関数は積分を用いて確率を表現するため、置換積分の考え方を応用することで、確率変数を変更したときの新しい確率密度関数を求めることができる。この記事では、そのような...

より、 \(u\) の確率密度関数 \(q(u)\) は

$$q(u)=\int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))\prod_{i=1}^{N}\mathcal{N}(x_i|0,\sigma)dx_1dx_2\cdots dx_N$$

と表せる。

平均 \(0\) 、分散 \(\sigma^2\) の正規分布

$$\mathcal{N}(x_i|0,\sigma^2)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp(-\frac{1}{2\sigma^2}x_i^2)$$

を代入すると

$$q(u)=\int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))(2\pi\sigma^2)^{-\frac{N}{2}}\exp\{-\frac{1}{2\sigma^2}(x_1^2+x_2^2+\cdots+x_N^2)\}dx_1dx_2\cdots dx_N$$

となる。

ここで、 \(N\) 次元球座標への変数変換を行うと、動径座標を \(r\) としたとき

$$r^{2}=x_1^2+x_2^2+\cdots+x_N^2$$

とできるので、被積分関数を \(r\) のみに依存する関数として扱うことができる。

\(N\) 次元空間における単位球表面の面素を \(dS_{1,N}\) とおくと、この変換においては

$$dx_1dx_2\cdots dx_N=r^{N-1}drdS_{1,N}$$

標準正規分布の規格化条件から、M次元単位球の表面積を求める
正規分布$$\mathcal{N}(x|\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\{-\frac{1}{2\sigma^2}(x-\mu)^2\}$$は様々な特徴を持つ重要な分布であるが、こ...

が成り立つので

$$q(u)=\int_{R}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)drdS_{1,N}$$

として、変数変換が実行できる(ただし、 \(R\) は適当な積分区間を表す)。

ここで、被積分関数が \(r\) のみに依存することから \(S_{1,N}\) についての積分を別に行うことができ、さらに \(r\) の積分区間が \([0,\infty)\) となることを考慮すると

$$q(u)=\int_{0}^{\infty}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)dr \int dS_{1,N}$$

となり、さらに

$$v=ar^2$$

とおいて

$$dv=2ar\,dr=2a\sqrt{\frac{v}{a}}\,dr$$

より、もう一度 \(r\) から \(v\) への変数変換を行うと

$$q(u)=\int_{0}^{\infty}\frac{1}{2a}(\frac{v}{a})^{\frac{N-1}{2}}\cdot(\frac{v}{a})^{-\frac{1}{2}}\delta(u-v)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}\cdot\frac{v}{a})dv\int dS_{1,N}$$

$$=\frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}\int_{0}^{\infty}\delta(u-v)(\frac{v}{a})^{\frac{N}{2}-1}\exp(-\frac{v}{2a\sigma^2})dv \int dS_{1,N}$$

となる。

この積分を行うには、ディラックのデルタ関数の性質

$$\int_{-\infty}^{\infty}f(x)\delta(x-a)dx=f(a)$$

$$\delta(-x)=\delta(x)$$

クロネッカーのデルタ/ディラックのデルタ関数
概要クロネッカーのデルタ・ディラックのデルタ関数を定義し、それらが持つ性質を網羅的に解説する。この記事を読むことで、クロネッカーのデルタ・ディラックのデルタ関数のイメージを掴み、数式上で条件分岐やパルスを表現することができるようになる。クロ...

と、 \(N\) 次元空間における単位球表面の面素と表面積の関係

$$S_{1,M}\equiv\int dS_{1,M}=\frac{2\pi^{\frac{M}{2}}}{\Gamma(\frac{M}{2})}$$

標準正規分布の規格化条件から、M次元単位球の表面積を求める
正規分布$$\mathcal{N}(x|\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\{-\frac{1}{2\sigma^2}(x-\mu)^2\}$$は様々な特徴を持つ重要な分布であるが、こ...

を用いる。

これらを適用すると

$$q(u)=\frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}(\frac{u}{a})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})\frac{2\pi^{\frac{N}{2}}}{\Gamma(\frac{N}{2})}$$

$$=\frac{1}{2a\sigma^2\Gamma(\frac{N}{2})}(\frac{u}{a\sigma^2})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})$$

が導かれ、 \(u\) の確率密度関数は自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) になることがわかる。

コメント