自然科学超幾何分布の性質と近似―二項分布とポワソン分布との関係 4 (1) 概要 この記事では、超幾何分布の性質について簡単に説明した後、特定の条件下で、超幾何分布が二項分布、そしてポワソン分布に近似されることを示す。 超幾何分布 全 \(N\) 個のうち、 \(K\) 個が「成功」(赤玉・白玉などで考えて良い)で... 2021.11.04自然科学
自然科学ポワソン分布の意味―二項分布からの導出 5 (1) 概要 ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。 この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。 二項分布 確率 \(p\) で... 2021.11.04自然科学
自然科学確率変数の線形変換 0 (0) 公式 確率変数 \(X\) は確率密度関数 \(f(x)\) にしたがうとする。 線形変換 $$Y=aX+b$$ (ただし、 \(b\neq0\) )を行ったとき、 \(Y\) の確率密度関数 \(g(y)\) は $$g(y)=\frac... 2021.10.07自然科学
自然科学有界な分布(一様分布)を用いたEMアルゴリズム 0 (0) 導入 以前 にて、 EMアルゴリズムを適用するに際し、一様分布のような明確な境界を持つ分布を使用すると、少し特殊な配慮が必要になる と述べた。 本記事では、実践を通して、こうした有界な分布を用いたEMアルゴリズムがどのように失敗するか... 2021.10.02自然科学
自然科学一般のEMアルゴリズムの理論と実践 0 (0) 概要 EMアルゴリズムを混合正規分布に適用した際の計算方法については、例えば以下の記事で紹介されている。 しかし、一般の場合(正規分布以外の混合分布)についてのEMアルゴリズムの実践例は、あまり紹介されていない。この記事では、混合正規分布... 2021.10.01自然科学
自然科学一様分布の最尤推定 0 (0) 公式 一様分布 \(U(x|a,b)\) のパラメータについて、データ \(X=\{x_1,x_2,\ldots,x_N\}\) を用いて最尤推定を行ったとき $$a=\min(X), b=\max(X)$$ となる。ここで、 \(\min... 2021.09.30自然科学
プログラミング仮想データセット配布【逆問題・不良設定問題】 0 (0) 概要 不良設定問題に対する機械学習を行うための、仮想データセットを作成した。 このデータセットでは、dataに3種類の(仮想の)血液検査値が与えられており、この値から、targetとして与えられた、体内に存在する8種類の(仮想の)細菌の比... 2021.06.25プログラミング自然科学
プログラミング尤度と誤差の関係―ガウス誤差モデル下のAIC, BIC 4 (1) 概要 WikipediaのBIC(ベイズ情報量基準)のページを読んでいると、BICは $$\mathrm{BIC}=-2\cdot\ln(L)+k\ln(n)\tag{1}$$ と定義されるが、ガウス誤差の下では $$\mathrm{BIC... 2021.06.18プログラミング自然科学
プログラミング01-Kendall 順位相関係数の効率的な計算法 0 (0) 概要 この記事では、 01-Kendall 順位相関係数 2 値 Kendall 順位相関係数 Binary Kendall 順位相関係数 などと呼ばれそうな、Kendall 順位相関係数 の特殊な場合の計算法についてまとめる。ようす... 2021.05.29プログラミング神経科学自然科学
プログラミング同一の分布にしたがう確率変数の最大値の分布 0 (0) 動機 乱数をたくさん発生させたとき、その最大値はどんなふうに分布することになるのか気になった。 問題 確率密度関数 \(f\) にしたがう連続確率変数 \(X\) を考える。独立に \(n\) 個のサンプルを発生させ、その最大値を \(Y\... 2021.05.26プログラミング自然科学