数学

Sponsored
確率・統計

超幾何分布に基づく集合の類似度指標

概要 2集合の類似度を測る指標として、Jaccard係数などの手法が知られている。 しかし、2集合の要素となりうる全要素の数と2集合の要素数が所与の場合には、これらの値に依存して、2集合が共通要素を持つ確率が大きく変動する。 この変動を補正...
確率・統計

超幾何分布の効率的数値計算法

概要 超幾何分布の確率質量関数は $$P(x|N,K,n)=\frac{\binom{K}{x}\binom{N-K}{n-x}}{\binom{N}{n}}$$ であり、これをすべての \(x\) について計算することによって累積分布関数...
確率・統計

超幾何分布の性質と近似―二項分布とポワソン分布との関係

概要 この記事では、超幾何分布の性質について簡単に説明した後、特定の条件下で、超幾何分布が二項分布、そしてポワソン分布に近似されることを示す。 超幾何分布 全 \(N\) 個のうち、 \(K\) 個が「成功」(赤玉・白玉などで考えて良い)で...
確率・統計

ポワソン分布の意味―二項分布からの導出

概要 ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。 この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。 二項分布 確率 \(p\) で...
数学

部分積分の導出

概要 部分積分の公式が永遠に覚えられないので、合成関数の微分公式から導出してしまおうという話です。 公式 部分積分 $$\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x)dx$$ ただし、 \(f(x)=F'(x...
数学

Properな複素確率変数の意味

概要 この記事では、複素確率変数における"Proper"とは何かについて、その定義と性質を見ていく。 なお、複素確率変数については以下を参照のこと。 Properとは 定義 複素確率変数 \(Z\) が以下の条件をすべて満たすとき、 \(Z...
確率・統計

確率変数の線形変換

確率変数の線形変換の公式 確率変数 \(X\) は確率密度関数 \(f(x)\) にしたがうとします。 確率変数の線形変換 $$Y=aX+b$$ (ただし、 \(a\neq0\) )を行ったとき、 \(Y\) の確率密度関数 \(g(y)\...
確率・統計

複素確率変数の性質

概要 複素確率変数はその名の通り、複素数の形態をとる確率変数のことである。 複素数が \(z=a+ib\) の形で表されることを考慮すれば、複素確率変数は実数の確率変数の組 \((a, b)\) として考えることができ、多次元確率変数の知見...
機械学習・AI

有界な分布を用いたEMアルゴリズムが、なぜ失敗するのか?【一様分布】

EMアルゴリズムは任意の確率分布からなる混合分布に対して適用可能だが、有界な分布を用いた場合には失敗しやすい。この記事では、一様分布を例にその理由を示したあと、Eステップ/Mステップの前にサンプリングを実施することで失敗を回避する方法について解説する。
機械学習・AI

任意の確率分布でEMアルゴリズムを理解・実装する【正規分布以外も】

EMアルゴリズムは、混合正規分布の条件下で解説・実装される場合が多い。しかし本来、近似には任意の分布を用いることができる。この記事では、混合正規分布の場合に限らない任意の確率分布に対するEMアルゴリズムについて、理論と実践例をコードとともに提示する。