1次元正規変数の平方和がしたがう分布【カイ二乗分布】の導出

確率・統計
Sponsored

独立の正規分布にしたがう確率変数を複数用意し、それらを2乗して足し合わせて新たな確率変数を作ったとき、その変数はカイ二乗分布にしたがう。

この記事では、確率変数の変換にともなう確率密度関数の変換公式を出発点にして、平方和とカイ二乗分布の関係を導出する

定理

正規分布 \(\mathcal{N}(0,\sigma)\) に独立にしたがう \(N\) 個の確率変数 \(x_1,x_2,\cdots,x_N\) と定数 \(a> 0\) により定義される、新たな確率変数

$$u \equiv a(x_1^2+x_2^2+\cdots+x_N^2)$$

は、自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) にしたがう。

証明

前提となる知識(カイ二乗分布)

確率変数 \(u\) についての、自由度 \(k\) 、スケール因子 \(s\) のカイ二乗分布 \(\chi^2(u|k,s)\) は、以下のように定義される。

$$\chi^2(u|k,s)\equiv\frac{1}{2s\Gamma(\frac{k}{2})}(\frac{u}{2s})^{\frac{k}{2}-1}\exp(-\frac{u}{2s})$$

ここで、 \(\Gamma\) はガンマ関数を表し、確率変数 \(z\) についてのガンマ関数 \(\Gamma(z)\) は以下のように定義される。

$$\Gamma(z)\equiv\int_{0}^{\infty}t^{z-1}e^{-t}dt$$

確率変数の変換

確率変数の変換に伴う確率密度関数の変換公式

\(M\) 次元の確率変数 \({\bf x}=(x_1,x_2,\cdots,x_M)\) が、 \(z=f({\bf x})=f(x_1,x_2,\cdots,x_M)\) によって \(1\) 次元の確率変数 \(z\) に変換されるとき、

\(z\) の確率密度関数 \(q(z)\) は、 \({\bf x}\) の確率密度関数 \(p(x_1,x_2,\cdots,x_M)\) を用いて以下のように表される。

$$q(z)=\int_{R}\delta(z-f(x_1,x_2,\cdots,x_M))p(x_1,x_2,\cdots,x_M)d{\bf x}$$

確率密度関数における変数変換の公式と、その考え方
確率密度関数は積分を用いて確率を表現する方法です。そのため、確率変数を変換した際には置換積分を応用することで、対応する確率密度関数を求めることができます。この記事では、確率密度関数やヤコビアンの性質からスタートし、確率密度関数を変換する公式と考え方について解説します。

より、 \(u\) の確率密度関数 \(q(u)\) は

$$q(u)=\int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))\prod_{i=1}^{N}\mathcal{N}(x_i|0,\sigma)dx_1dx_2\cdots dx_N$$

と表せる。

平均 \(0\) 、分散 \(\sigma^2\) の正規分布

$$\mathcal{N}(x_i|0,\sigma^2)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp(-\frac{1}{2\sigma^2}x_i^2)$$

を代入すると

$$q(u)=\int_{-\infty}^{\infty}\delta(u-a(x_1^2+x_2^2+\cdots+x_N^2))(2\pi\sigma^2)^{-\frac{N}{2}}\exp\{-\frac{1}{2\sigma^2}(x_1^2+x_2^2+\cdots+x_N^2)\}dx_1dx_2\cdots dx_N$$

となる。

ここで、 \(N\) 次元球座標への変数変換を行うと、動径座標を \(r\) としたとき

$$r^{2}=x_1^2+x_2^2+\cdots+x_N^2$$

とできるので、被積分関数を \(r\) のみに依存する関数として扱うことができる。

\(N\) 次元空間における単位球表面の面素を \(dS_{1,N}\) とおくと、この変換においては

$$dx_1dx_2\cdots dx_N=r^{N-1}drdS_{1,N}$$

多重積分を極座標変換して簡略化する(M次元単位球の表面積も導出)
多重積分の独立した変数が動径としてまとめられるとき、変数を極座標に変換することで、計算を簡略化することができます。具体的には、複数の変数による積分が、1変数の積分と単位球の表面積の積に変換できます。この記事では、変数を極座標に変換する方法と面素を用いて変数をまとめる方法を解説し、最後に極座標変換の性質を応用して、多次元単位球の表面積を導出します。

が成り立つので

$$q(u)=\int_{R}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)drdS_{1,N}$$

として、変数変換が実行できる(ただし、 \(R\) は適当な積分区間を表す)。

ここで、被積分関数が \(r\) のみに依存することから \(S_{1,N}\) についての積分を別に行うことができ、さらに \(r\) の積分区間が \([0,\infty)\) となることを考慮すると

$$q(u)=\int_{0}^{\infty}r^{N-1}\delta(u-ar^2)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}r^2)dr \int dS_{1,N}$$

となり、さらに

$$v=ar^2$$

とおいて

$$dv=2ar\,dr=2a\sqrt{\frac{v}{a}}\,dr$$

より、もう一度 \(r\) から \(v\) への変数変換を行うと

$$q(u)=\int_{0}^{\infty}\frac{1}{2a}(\frac{v}{a})^{\frac{N-1}{2}}\cdot(\frac{v}{a})^{-\frac{1}{2}}\delta(u-v)(2\pi\sigma^2)^{-\frac{N}{2}}\exp(-\frac{1}{2\sigma^2}\cdot\frac{v}{a})dv\int dS_{1,N}$$

$$=\frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}\int_{0}^{\infty}\delta(u-v)(\frac{v}{a})^{\frac{N}{2}-1}\exp(-\frac{v}{2a\sigma^2})dv \int dS_{1,N}$$

となる。

この積分を行うには、ディラックのデルタ関数の性質

$$\int_{-\infty}^{\infty}f(x)\delta(x-a)dx=f(a)$$

$$\delta(-x)=\delta(x)$$

定義とイメージで理解する、クロネッカーのデルタ/ディラックのデルタ関数
デルタ関数は条件分岐や積分で活躍する便利な関数です。ここではクロネッカーのデルタ・ディラックのデルタ関数を定義し、それらが持つ性質を網羅的に解説します。この記事を読むことで、デルタ関数のイメージを掴み、数式上でif文やパルスを表現することができるようになります。

と、 \(N\) 次元空間における単位球表面の面素と表面積の関係

$$S_{1,M}\equiv\int dS_{1,M}=\frac{2\pi^{\frac{M}{2}}}{\Gamma(\frac{M}{2})}$$

多重積分を極座標変換して簡略化する(M次元単位球の表面積も導出)
多重積分の独立した変数が動径としてまとめられるとき、変数を極座標に変換することで、計算を簡略化することができます。具体的には、複数の変数による積分が、1変数の積分と単位球の表面積の積に変換できます。この記事では、変数を極座標に変換する方法と面素を用いて変数をまとめる方法を解説し、最後に極座標変換の性質を応用して、多次元単位球の表面積を導出します。

を用いる。

これらを適用すると

$$q(u)=\frac{1}{2a}(2\pi\sigma^2)^{-\frac{N}{2}}(\frac{u}{a})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})\frac{2\pi^{\frac{N}{2}}}{\Gamma(\frac{N}{2})}$$

$$=\frac{1}{2a\sigma^2\Gamma(\frac{N}{2})}(\frac{u}{a\sigma^2})^{\frac{N}{2}-1}\exp(-\frac{u}{2a\sigma^2})$$

が導かれ、 \(u\) の確率密度関数は自由度 \(N\) 、スケール因子 \(a\sigma^2\) のカイ二乗分布 \(\chi^2(u|N,a\sigma^2)\) になることがわかる。

Comments