【統計検定1級】対策記事集

確率・統計
Sponsored

概要

統計検定1級の勉強に役立ちそうな記事のリンク集。

実際に筆者が統計検定1級を受験したときに、勉強を兼ねて執筆していた記事がほとんどです。

なお、筆者は一発で「統計数理」「統計応用」ともに合格できたため、学習方針としては間違っていないと思われます。

記事一覧

確率基礎

条件付き確率・ベイズの定理

現代的な統計学の最重要事項である、条件付き確率ベイズの定理について解説します。

ベイズの定理の考え方と使い方【独立性や条件付き確率から丁寧に】
「2つの事象が同時に生じる確率」を同時確率といいます。同時確率を計算する方法について、事象の独立性や条件付き確率を通して考え、最終的にベイズの定理を導きます。この記事を読むことで、ベイズの定理を効果的に利用するための方法を理解することができます。

統計学基礎としての集合論

集合論の基礎的な考え方のひとつとして、単調増大列・単調減少列について解説します。

単調増大列・単調減少列の定義と性質【確率の連続性を導くために】
事象の列を構成する要素が互いに包含関係にあるとき、その方向によって単調増大列または単調減少列と呼ばれます。この記事では、単調増大列と単調減少列の定義と性質を解説し、これらが収束することに基づいて確率の連続性という性質を証明します。確率の連続性は、無限回の試行についての確率を考えるための重要な関係式を導きます。

事象の複合を確率・集合論で取り扱うための、和事象の考え方について解説します。

一般の和事象の確率―その証明と極限
2つの事象のどちらか一方、または両方が起こることを和事象(AまたはB)といいます。この記事では、ベン図を用いて和事象の確率を計算する方法について解説し、それぞれの事象の確率の和との関係について、一般の場合と極限を考えます。

上極限集合と下極限集合、そしてボレル・カンテリの補題という、統計学基礎としての集合論における最難関事項のひとつを解説します。

上極限集合/下極限集合とボレル・カンテリの補題【無限回試行の確率】
上極限集合と下極限集合を定義し、ボレル・カンテリの補題を導きます。これらは式にすると複雑に見えますが、ことばで表現すると簡単に理解することができます。とくにボレル・カンテリの補題は、無限回の試行に対する確率について、私たちの直観にあう解釈を成り立たせるための、基礎的な条件を述べたものに過ぎません。

確率分布と期待値

一般

確率変数・確率密度関数という、統計学において何度も登場する(そして誤解しやすい)用語について解説します。

【図解】確率変数と確率密度関数を正確に、そして直観的に理解する
確率論で用いられる確率質量関数と確率密度関数について、確率変数の定義から出発して、実例や用途に基づいて直観的に解説します。これらの用語は非常に誤解しやすいのですが、この記事を読むことで、それぞれの正確な意味を押さえ、関連する性質や定理についての理解を早めることができるようになります。

確率変数を変換することによって新たな確率分布を導いたり、計算を簡単にしたりする際の必須の考え方について解説します。

確率密度関数における変数変換の公式と、その考え方
確率密度関数は積分を用いて確率を表現する方法です。そのため、確率変数を変換した際には置換積分を応用することで、対応する確率密度関数を求めることができます。この記事では、確率密度関数やヤコビアンの性質からスタートし、確率密度関数を変換する公式と考え方について解説します。

一様分布

「とある範囲の数字が同確率で出る」という、一様分布の性質について解説します。これは、いわゆる「乱数」を表現したものであり、最も基本的な確率分布であると考えることができます。

一様分布の定義・性質とその証明
定義 連続変数 \(x\) が、有限区間 \(x\in\) で一様分布する場合、その確率密度関数 \(p(x)\) は $$p(x)=\frac{1}{b-a}$$ で定義される。 より一般に、分布が一様分布であることを明示して $$p(x...

データから一様分布を最尤推定する、という、結構ニッチな方法(しかし結論は至極妥当なこと)について解説します。

一様分布の最尤推定
公式 一様分布 \(U(x|a,b)\) のパラメータについて、データ \(X=\{x_1,x_2,\ldots,x_N\}\) を用いて最尤推定を行ったとき $$a=\min(X), b=\max(X)$$ となる。ここで、 \(\min...

ポワソン分布

ポワソン分布を二項分布から導出することで、「稀な現象が起こる回数とその確率の分布」の意味を実感します。

ポワソン分布の意味―二項分布からの導出
概要 ポワソン分布は「所与の時間内での事象の生起回数の確率分布」として広く使われる分布である。 この記事の目的は、ポワソン分布を二項分布から導出することによって、この分布の意味するところを実感することである。 二項分布 確率 \(p\) で...

超幾何分布

「数個の赤玉と白玉を取り出す確率」を表す分布である、超幾何分布について解説し、二項分布・ポワソン分布との関係について考察します。

超幾何分布の性質と近似―二項分布とポワソン分布との関係
概要 この記事では、超幾何分布の性質について簡単に説明した後、特定の条件下で、超幾何分布が二項分布、そしてポワソン分布に近似されることを示す。 超幾何分布 全 \(N\) 個のうち、 \(K\) 個が「成功」(赤玉・白玉などで考えて良い)で...

指数分布

「稀な事象が生じるまでの時間とその確率」を表す分布である指数分布について、最尤推定法・(平均)パラメータ変換・乱数生成という実践的な技術を紹介します。

指数分布の性質と、最尤推定・パラメータ変換・乱数生成まで
指数分布を定義し、平均や分散といった基本的な性質を示す。その後、最尤推定によりパラメータの値を求める、パラメータを変換してデータをスケーリングする、逆関数法により乱数を生成するという、指数関数の実用テクニックを網羅的に解説する。また、文末にはPython言語による計算例を示し、上記の実用テクニックを一通り体験できるようにした。

正規分布

エントロピー最大化原理に基づいて、正規分布を導出する方法について解説します。

エントロピーの最大化による正規分布の導出
正規分布は「エントロピーを最大化する」という性質を持った確率分布であるため、統計学で重宝されています。この記事では、正規分布、エントロピー、確率密度関数の意味について確認し、これらを用いて正規分布を導出します。また、導出に際して汎関数や変分法についても解説します。

最尤推定法を用いて、データに対応した正規分布のパラメータを求める方法について解説します。

最尤推定法による正規分布へのフィッティング
観測された複数のデータがとある分布に基づいていると仮定して、その分布の形状を決定するパラメータを求める際、最尤推定法という手法がよく用いられる。この記事では、観測された結果が正規分布に従うと仮定した際に、最尤推定法を用いて平均 \(\mu\...

上の記事と同様のことを、多次元の正規分布について行います。

最尤推定法による多次元正規分布へのフィッティング
1次元の場合と同様に、対数尤度関数の微分を \(0\) とおくことで、多次元正規分布(多次元ガウス分布)にデータをフィットさせる。 定義 多次元正規分布 $$\mathcal{N}({\bf x}|{\boldsymbol \mu},{\b...

正規分布にしたがう変数の(線形)和は、正規分布にしたがうことについて、導出しつつ解説します。

1次元正規分布の1次結合についての公式
定理 \(x\) と \(x'\) が独立に正規分布 \(\mathcal{N}(\mu,\sigma)\) にしたがうとき、定数 \(a,b\) を用いて作られる確率変数 \(ax+bx'\) は、平均 \((a+b)\mu\) 、分散 ...
1次元正規変数の平方和がしたがう分布【カイ二乗分布】の導出
独立の正規分布にしたがう確率変数を複数用意し、それらを2乗して足し合わせて新たな確率変数を作ったとき、その変数はカイ二乗分布にしたがう。この記事では、確率変数の変換にともなう確率密度関数の変換公式を出発点にして、平方和とカイ二乗分布の関係を導出する。

順序統計量

同一の分布にしたがう確率変数の最大値の分布
動機 乱数をたくさん発生させたとき、その最大値はどんなふうに分布することになるのか気になった。 問題 確率密度関数 \(f\) にしたがう連続確率変数 \(X\) を考える。独立に \(n\) 個のサンプルを発生させ、その最大値を \(Y\...
一般の順序統計量の確率分布
概要 この記事では順序統計量を定義し、その値がしたがう分布を導出する。 順序統計量の定義 同一の確率密度関数 \(f(x)\) から独立に得られた確率変数の組 \(X_1,X_2,\cdots,X_n\) を考える。 これらを小さいもの順に...

確率変数の収束

確率変数の列の収束とスラツキーの定理
概要 この記事では、確率変数の列の収束の概念を、確率収束と分布収束の2様式から説明する。 また、それらがみたす関係について紹介し、そこから派生したスラツキーの定理についても取り扱う。 最後に、それぞれの公式・定理についての証明を付した。 表...

「確率変数の列の収束」という概念を解説(確率収束・分布収束)。スラツキーの定理の証明も行う。

デルタ法の導出と、漸近分散近似への応用
概要 デルタ法は、分布収束する先が決まっている確率変数の列に対し変換を施したとき、収束先がどのように変化するかを近似的に表現する手法である。 また、正規分布する確率変数の変換により得られた新たな確率変数の漸近分散を、変換前の変数の分散を用い...

中心極限定理との絡みでよく用いられる、デルタ法について解説し、2次まで応用する。

統計検定・推定

検出力に基づくサンプルサイズの決定(優越性/非劣性/同等性試験)
概要 この記事では、臨床試験等で優越性・非劣性・同等性の検証を行う際に、必要なサンプル数を計算する手法について解説する。サンプルサイズは、検出したい平均差と標準偏差を設定し、試験実施者が望む検出力の強度を与えることによって算出できる。最後に...
(補足)サンプルサイズが大きいことの何が問題か?
概要 先日、上の記事の中で、「サンプルサイズは小さすぎても大きすぎてもいけない」という説明をした。とはいえ、サンプルサイズが小さすぎる場合に検定がうまくいかないのは直感に沿うが、大きすぎる場合の問題点は少しわかりにくいかもしれない。それを補...

Comments