確率・統計

Sponsored
確率・統計

【統計検定1級対策】合格のための2つの考え方と7つのステップ

筆者は2021年の統計検定1級合格者(統計数理・統計応用(医薬生物学))です。 試験勉強を始めた当初、私には統計学のバックグラウンドはほぼありませんでした。 しかし、試験問題の傾向から見えた2つの考え方を軸に対策を練り、7つのステップを達成...
確率・統計

ゾウの体表面積を求める!―データサイエンスが役立つとき

概要 筆者の専門はデータサイエンスです。 しかし筆者は一時期、データサイエンティストはExcelとPythonをパチパチやって格好良いことを言うだけの虚業だと思い悩んだことがあり、なんなら今でも少しそう思っている節があります。 普段データを...
Matplotlib

誤差楕円(確率長円)とは?計算方法とPythonによるプロット

誤差楕円(確率長円)は、2次元正規分布の分散を図示した楕円です。正規分布の分散共分散行列から、任意の範囲をカバーする楕円の式を計算することができます。この記事では、PythonのMatplotlibでの描画を例に、楕円の計算方法を解説します。
確率・統計

分散共分散行列の対角化(2次元)

概要 この記事では、分散共分散行列が対角行列となるように変数変換を行う方法、もしくは分散の方向が独立となるような軸の見つけ方について解説し、その導出を行う。 これは、主成分分析(Principal Component Analysis; P...
確率・統計

多次元正規分布で逆行列を計算したくない!

概要 本記事では、コレスキー分解を用いて適切な変数変換を行うことで、多次元正規分布の確率密度関数に含まれる分散共分散行列の逆行列の数値計算を回避する方法について述べる。 多次元正規分布 \(M\) 次元正規分布の確率密度関数 $$\math...
Python

球面上の機械学習(パラメータの総和が一定となる条件下で)

概要 パラメータの総和が一定となる条件の下で、データから、これらのパラメータを学習(最適化)する方法を考える。すなわち $$x_1+x_2+\cdots+x_n=k$$ となる条件のもとで、これらのパラメータをデータに対し最適化することを考...
確率・統計

βダイバージェンスについて、さっと語る

概要 この記事では、βダイバージェンスと呼ばれる類似度指標の一群について、その定義と性質を簡単に解説する。 簡潔さを重視するため、用語ならびに記号はやや適当に用いているが、要望が多いようであればより厳密かつ詳細な記事を作成したい。 定義 確...
確率・統計

【統計検定1級】対策記事集

概要 統計検定1級の勉強に役立ちそうな記事のリンク集。 実際に筆者が統計検定1級を受験したときに、勉強を兼ねて執筆していた記事がほとんどです。 なお、筆者は一発で「統計数理」「統計応用」ともに合格できたため、学習方針としては間違っていないと...
確率・統計

集合の類似度指標まとめ

概要 この記事では、2集合の類似度を測る指標として、Jaccard係数、Dice係数、Simpson係数、Kendall相関係数、超幾何分布の累積分布に基づく指標を説明する。 一般的な指標は前3者であるが、ここでは、集合に含まれうる要素の全...
確率・統計

ガンマ関数と階乗の関係

概要 この記事ではガンマ関数を定義し、それが階乗の一般化として扱えることを示す。 また、ガンマ関数を階乗の比で表現する公式についても導出する。 最後に、公式を用いて、階乗の比をガンマ関数で表現することにより、数値計算上有利になることができる...