【統計検定1級】対策記事集

確率・統計
スポンサーリンク

概要

統計検定1級の勉強に役立ちそうな記事のリンク集。

実際に筆者が統計検定1級を受験したときに、勉強を兼ねて執筆していた記事がほとんどです。

なお、筆者は一発で「統計数理」「統計応用」ともに合格できたため、学習方針としては間違っていないと思われます。

記事一覧

確率基礎

条件付き確率・ベイズの定理

現代的な統計学の最重要事項である、条件付き確率ベイズの定理について解説します。

条件付き確率とベイズの定理
この記事では「2つの現象が同時に起こる確率」について議論し、その中で現象の独立性と条件付き確率について解説する。これらの議論からは、各種検査や機械学習などにおける確率的推論の基礎となる「ベイズの定理」が導ける。記号の定義この記事では、以下の...

統計学基礎としての集合論

集合論の基礎的な考え方のひとつとして、単調増大列・単調減少列について解説します。

単調増大・減少列と確率の連続性
定義\(\mathfrak{B}\)を可測集合族とする。事象の列\(A_{k}\in\mathfrak{B},\quadk=1,2,\ldots,\)について、\(A_{k}\)が\(A_{k}\subsetA_{k+1}\)をみたすとき単...

事象の複合を確率・集合論で取り扱うための、和事象の考え方について解説します。

和事象の確率とその一般化
和事象の確率定理事象\(A,B\)が生じる確率を、それぞれ\(P(A),P(B)\)とおくと、が成り立つ。証明上図を参照。確率を面積として捉えると、\(A\cupB\)に相当する面積を求めるためには、\(A,B\)の面積を足した後、\(A\...

上極限集合と下極限集合、そしてボレル・カンテリの補題という、統計学基礎としての集合論における最難関事項のひとつを解説します。

上極限集合/下極限集合とボレル・カンテリの補題
上極限集合と下極限集合定義\(A_{1},A_{2},\dots\)を集合の列とする。このとき、上極限集合と下極限集合をそれぞれで定義する。数式による解釈定義式の各パーツについて、条件式を用いて書き直すと、であるので、定義式はと表すことがで...

確率分布と期待値

一般

確率変数・確率密度関数という、統計学において何度も登場する(そして誤解しやすい)用語について解説します。

確率質量関数と確率密度関数を正確に、そして直観的に理解する
確率論で用いられる確率質量関数と確率密度関数について、確率変数の定義から出発して、実例や用途に基づいて直観的に解説する。これらの用語は非常に誤解しやすいが、この記事を読むことで、それぞれの正確な意味を押さえ、関連する性質や定理についての理解...

確率変数を変換することによって新たな確率分布を導いたり、計算を簡単にしたりする際の必須の考え方について解説します。

確率変数の変換に伴う確率密度関数の変換公式
この記事の簡略版線形変換\(Y=aX+b\)の場合の簡略版はこちら。概要確率密度関数は積分を用いて確率を表現するため、置換積分の考え方を応用することで、確率変数を変更したときの新しい確率密度関数を求めることができる。この記事では、そのような...

一様分布

「とある範囲の数字が同確率で出る」という、一様分布の性質について解説します。これは、いわゆる「乱数」を表現したものであり、最も基本的な確率分布であると考えることができます。

一様分布の定義・性質とその証明
定義連続変数\(x\)が、有限区間\(x\in\)で一様分布する場合、その確率密度関数\(p(x)\)は$$p(x)=\frac{1}{b-a}$$で定義される。より一般に、分布が一様分布であることを明示して$$p(x)=U(x|a,b)=...

データから一様分布を最尤推定する、という、結構ニッチな方法(しかし結論は至極妥当なこと)について解説します。

一様分布の最尤推定
公式一様分布\(U(x|a,b)\)のパラメータについて、データ\(X=\{x_1,x_2,\ldots,x_N\}\)を用いて最尤推定を行ったとき$$a=\min(X),b=\max(X)$$となる。ここで、\(\min(A),\max(...

ポワソン分布

ポワソン分布を二項分布から導出することで、「稀な現象が起こる回数とその確率の分布」の意味を実感します。

ポワソン分布の意味―二項分布からの導出
概要ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。二項分布確率\(p\)で成功する試行...

超幾何分布

「数個の赤玉と白玉を取り出す確率」を表す分布である、超幾何分布について解説し、二項分布・ポワソン分布との関係について考察します。

超幾何分布の性質と近似―二項分布とポワソン分布との関係
概要この記事では、超幾何分布の性質について簡単に説明した後、特定の条件下で、超幾何分布が二項分布、そしてポワソン分布に近似されることを示す。超幾何分布全\(N\)個のうち、\(K\)個が「成功」(赤玉・白玉などで考えて良い)である要素のうち...

指数分布

「稀な事象が生じるまでの時間とその確率」を表す分布である指数分布について、最尤推定法・(平均)パラメータ変換・乱数生成という実践的な技術を紹介します。

指数分布の性質と、最尤推定・パラメータ変換・乱数生成まで
指数分布を定義し、平均や分散といった基本的な性質を示す。その後、最尤推定によりパラメータの値を求める、パラメータを変換してデータをスケーリングする、逆関数法により乱数を生成するという、指数関数の実用テクニックを網羅的に解説する。また、文末にはPython言語による計算例を示し、上記の実用テクニックを一通り体験できるようにした。

正規分布

エントロピー最大化原理に基づいて、正規分布を導出する方法について解説します。

エントロピーの最大化による正規分布の導出
この記事では、エントロピーを最大化する確率分布を求めることで、正規分布$$\mathcal{N}(x|\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{1}{2\sigma...

最尤推定法を用いて、データに対応した正規分布のパラメータを求める方法について解説します。

最尤推定法による正規分布へのフィッティング
観測された複数のデータがとある分布に基づいていると仮定して、その分布の形状を決定するパラメータを求める際、最尤推定法という手法がよく用いられる。この記事では、観測された結果が正規分布に従うと仮定した際に、最尤推定法を用いて平均\(\mu\)...

上の記事と同様のことを、多次元の正規分布について行います。

最尤推定法による多次元正規分布へのフィッティング
1次元の場合と同様に、対数尤度関数の微分を\(0\)とおくことで、多次元正規分布(多次元ガウス分布)にデータをフィットさせる。定義多次元正規分布$$\mathcal{N}({\bfx}|{\boldsymbol\mu},{\boldsymb...

正規分布にしたがう変数の(線形)和は、正規分布にしたがうことについて、導出しつつ解説します。

1次元正規分布の1次結合についての公式
定理\(x\)と\(x'\)が独立に正規分布\(\mathcal{N}(\mu,\sigma)\)に従うとき、定数\(a,b\)を用いて作られる確率変数\(ax+bx'\)は、平均\((a+b)\mu\)、分散\(\sigma^2(a^2+...
1次元正規変数の平方和がしたがう分布【カイ二乗分布】の導出
独立の正規分布にしたがう確率変数を複数用意し、それらを2乗して足し合わせて新たな確率変数を作ったとき、その変数はカイ二乗分布にしたがう。この記事では、確率変数の変換にともなう確率密度関数の変換公式を出発点にして、平方和とカイ二乗分布の関係を導出する。

順序統計量

同一の分布にしたがう確率変数の最大値の分布
動機乱数をたくさん発生させたとき、その最大値はどんなふうに分布することになるのか気になった。問題確率密度関数\(f\)にしたがう連続確率変数\(X\)を考える。独立に\(n\)個のサンプルを発生させ、その最大値を\(Y\)とする。すなわち$...
一般の順序統計量の確率分布
概要この記事では順序統計量を定義し、その値がしたがう分布を導出する。順序統計量の定義同一の確率密度関数\(f(x)\)から独立に得られた確率変数の組\(X_1,X_2,\cdots,X_n\)を考える。これらを小さいもの順に並び替え、\(U...

確率変数の収束

確率変数の列の収束とスラツキーの定理
概要この記事では、確率変数の列の収束の概念を、確率収束と分布収束の2様式から説明する。また、それらがみたす関係について紹介し、そこから派生したスラツキーの定理についても取り扱う。最後に、それぞれの公式・定理についての証明を付した。表記確率変...

「確率変数の列の収束」という概念を解説(確率収束・分布収束)。スラツキーの定理の証明も行う。

デルタ法の導出と、漸近分散近似への応用
概要デルタ法は、分布収束する先が決まっている確率変数の列に対し変換を施したとき、収束先がどのように変化するかを近似的に表現する手法である。また、正規分布する確率変数の変換により得られた新たな確率変数の漸近分散を、変換前の変数の分散を用いて計...

中心極限定理との絡みでよく用いられる、デルタ法について解説し、2次まで応用する。

統計検定・推定

検出力に基づくサンプルサイズの決定(優越性/非劣性/同等性試験)
概要この記事では、臨床試験等で優越性・非劣性・同等性の検証を行う際に、必要なサンプル数を計算する手法について解説する。サンプルサイズは、検出したい平均差と標準偏差を設定し、試験実施者が望む検出力の強度を与えることによって算出できる。最後に、...
(補足)サンプルサイズが大きいことの何が問題か?
概要先日、上の記事の中で、「サンプルサイズは小さすぎても大きすぎてもいけない」という説明をした。とはいえ、サンプルサイズが小さすぎる場合に検定がうまくいかないのは直感に沿うが、大きすぎる場合の問題点は少しわかりにくいかもしれない。それを補足...

コメント