確率・統計

Sponsored
確率・統計

Kendall 順位相関係数の定義と確率分布

この記事では、2配列の順序の相関を表す指標である、Kendall 順位相関係数について解説する。 まず、同義の Kendall の \(\tau\) (タウ)を最も簡単な形式で定義した後、2配列間の相関係数としてそれを拡張する。 また、この...
確率・統計

検出力に基づくサンプルサイズの決定(優越性/非劣性/同等性試験)

概要 この記事では、臨床試験等で優越性・非劣性・同等性の検証を行う際に、必要なサンプル数を計算する手法について解説する。サンプルサイズは、検出したい平均差と標準偏差を設定し、試験実施者が望む検出力の強度を与えることによって算出できる。最後に...
Python

【Box-Muller法】標準正規分布にしたがう乱数生成

ボックス=ミュラー法(Box-Muller's method)は、一様分布にしたがう確率変数から、標準正規分布にしたがう確率変数を生成する手法です。 コンピュータで標準で生成できる乱数から、正規分布にしたがう乱数(正規乱数)を作るために使用...
Python

指数分布の性質と、最尤推定・パラメータ変換・乱数生成まで

指数分布を定義し、平均や分散といった基本的な性質を示す。その後、最尤推定によりパラメータの値を求める、パラメータを変換してデータをスケーリングする、逆関数法により乱数を生成するという、指数関数の実用テクニックを網羅的に解説する。また、文末にはPython言語による計算例を示し、上記の実用テクニックを一通り体験できるようにした。
Matplotlib

ヒストグラムと確率分布の同時プロット―フィッティング精度の検証用に

多数のデータ点が得られたとき のようなフィッティングを行えば、それらのデータ点が従う分布を推定することができる。この場合、データのヒストグラムはその分布に類似した形状をとるはずであり、そのことを視覚的に確かめたい(または、その推定が正しいこ...
機械学習・AI

PRML(パターン認識と機械学習)演習問題【難問】解答集

C.M.ビショップ著、PRML(パターン認識と機械学習―ベイズ理論による統計的予測、)の演習問題において、【難問】に指定されている問題の解答集。解答を当サイトに投稿し次第、またはどこかで見つけ次第、リンクを増やしていく。
機械学習・AI

【PRML10章 演習10.39解答】EP法による事後分布の更新

PRML10章 演習10.39の解答・解説。EP法によって更新した事後分布の平均と分散を導出する。それに際し、パラメータの期待値を計算する。その後近似因子のパラメータを求め、モデルエビデンスが近似される値を導く。
機械学習・AI

PRML10章 演習10.39解答(その4:(10.223),(10.224)の導出)

問題、記号の意味、利用した式については を参照。 目標 モデルエビデンスが $$p(\mathcal{D})\simeq\left(\frac{\nu^{\mathrm {new}}}{b}\right)^{D/2}\left\exp{\l...
機械学習・AI

PRML10章 演習10.39解答(その3:(10.220)-(10.222)の導出)

問題、記号の意味、利用した式については を参照。 目標 改良された近似因子 \(\tilde{f}_{n}(\boldsymbol{\theta})\) のパラメータが $$\nu_{n}^{-1}=(\nu^{\mathrm{new}})...
機械学習・AI

PRML10章 演習10.39解答(その2:(10.218)の導出)

問題、記号の意味、利用した式については を参照。 目標 \(q^{\mathrm{new}}(\boldsymbol{\theta})\) の平均と分散を \(q^{\backslash n}(\boldsymbol{\theta})f_{...