statistics

Sponsored
確率・統計

超幾何分布の効率的数値計算法

概要 超幾何分布の確率質量関数は $$P(x|N,K,n)=\frac{\binom{K}{x}\binom{N-K}{n-x}}{\binom{N}{n}}$$ であり、これをすべての \(x\) について計算することによって累積分布関数...
確率・統計

超幾何分布の性質と近似―二項分布とポワソン分布との関係

概要 この記事では、超幾何分布の性質について簡単に説明した後、特定の条件下で、超幾何分布が二項分布、そしてポワソン分布に近似されることを示す。 超幾何分布 全 \(N\) 個のうち、 \(K\) 個が「成功」(赤玉・白玉などで考えて良い)で...
確率・統計

ポワソン分布の意味―二項分布からの導出

概要 ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。 この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。 二項分布 確率 \(p\) で...
確率・統計

確率変数の線形変換

確率変数の線形変換の公式 確率変数 \(X\) は確率密度関数 \(f(x)\) にしたがうとします。 確率変数の線形変換 $$Y=aX+b$$ (ただし、 \(a\neq0\) )を行ったとき、 \(Y\) の確率密度関数 \(g(y)\...
機械学習・AI

有界な分布を用いたEMアルゴリズムが、なぜ失敗するのか?【一様分布】

EMアルゴリズムは任意の確率分布からなる混合分布に対して適用可能だが、有界な分布を用いた場合には失敗しやすい。この記事では、一様分布を例にその理由を示したあと、Eステップ/Mステップの前にサンプリングを実施することで失敗を回避する方法について解説する。
機械学習・AI

任意の確率分布でEMアルゴリズムを理解・実装する【正規分布以外も】

EMアルゴリズムは、混合正規分布の条件下で解説・実装される場合が多い。しかし本来、近似には任意の分布を用いることができる。この記事では、混合正規分布の場合に限らない任意の確率分布に対するEMアルゴリズムについて、理論と実践例をコードとともに提示する。
確率・統計

一様分布の最尤推定

公式 一様分布 \(U(x|a,b)\) のパラメータについて、データ \(X=\{x_1,x_2,\ldots,x_N\}\) を用いて最尤推定を行ったとき $$a=\min(X), b=\max(X)$$ となる。ここで、 \(\min...
プログラミング

仮想データセット配布【逆問題・不良設定問題】

概要 不良設定問題に対する機械学習を行うための、仮想データセットを作成した。 このデータセットでは、dataに3種類の(仮想の)血液検査値が与えられており、この値から、targetとして与えられた、体内に存在する8種類の(仮想の)細菌の比率...
Python

尤度と誤差の関係―ガウス誤差モデル下のAIC, BIC

概要 WikipediaのBIC(ベイズ情報量基準)のページを読んでいると、BICは $$\mathrm{BIC}=-2\cdot\ln(L)+k\ln(n)\tag{1}$$ と定義されるが、ガウス誤差の下では $$\mathrm{BIC...
確率・統計

01-Kendall 順位相関係数の効率的な計算法

概要 この記事では、 01-Kendall 順位相関係数 2 値 Kendall 順位相関係数 Binary Kendall 順位相関係数 などと呼ばれそうな、Kendall 順位相関係数 の特殊な場合の計算法についてまとめる。ようするに ...