汎関数と変分法について、わかりやすく解説

数学
Sponsored

「関数の関数」と呼ばれる汎関数と、汎関数を最大化(最小化)する変分法について解説します。

汎関数は通常の「関数-引数」の関係を、「汎関数-関数」の関係にそのまま置き換えることで簡単に理解できます

同様に変分法も、極値極値関数に置き換えたものと大差ありません。

汎関数の定義と例

あえて難しく、厳密に定義する

のちほど噛み砕いて説明しますが、いちおう厳密(な感じ)に汎関数を定義しておきます。

まず、関数の集合のことを関数族といいます。

そのうえで、汎関数は以下のように定義されます。

\({\bf I}\) を関数族とし、おのおのの関数 \(y \in {\bf I}\) に1つの数値 \(I[y]\) が対応しているとき、

この対応を与える \(I\) を汎関数という。

なお、関数と区別するために、汎関数 \(I\) の括弧には \([\quad]\) を使用します。

数式を使ったイメージ

上記で言っていることは、ほとんど関数の性質と同じです。

関数 \(y(x)\) は変数 \(x\) によって値が決まり、これは「変数に1つの数値が対応している」と表現できます。

つまり、変数 \(x\) の関数である \(y(x)\) の値が変数 \(x\) に依存するのと同様に、

関数 \(y\) の汎関数である \(I[y]\) の値は関数 \(y\) に依存する、ということです。

関数の「値に」依存するのではないことに注意。

正しくは、関数の種類に依存するイメージ

汎関数の例

汎関数の代表的な例としては、定積分

$$I[y]=\int_a^b y(x)dx$$

が挙げられます。ここでも \(y\) は変数 \(x\) の関数です。

\(y'\) を \(y\) 導関数とし、 \(F\) を \(x,y,y'\) を用いて定義される関数とすると、

$$I[y]=\int_a^b F(x,y(x),y'(x))dx \tag{1}$$

も汎関数になります。

なぜならば、導関数 \(y'\) は関数 \(y\) によって定まり、その結果、 \(F, I\) も \(y\) によって定まるためです。

このように、汎関数は関数とその導関数を含めて表現することができます。

変分法の意味と計算例

変分法の意味と、やりたいことのイメージ

変分法とは、汎関数 \(I[y]\) を最大(極大)または最小(極小)にする極値関数 \(y^*(x)\) を求めるための手法です。

その原理は、関数 \(f(x)\) が最大(極大)または最小(極小)となる点において1次導関数 \(f'(x)=0\) がとなることを利用する手法に似ています。

具体的には、汎関数の場合は1次変分 \(\delta I[y]\) を求めて

$$\delta I[y]=0$$

とおきます。

これをみたす(1次変分をゼロにする)関数 \(y_0\) のことを停留関数、また、このときの \(I\) の値を停留値といいます。

\(y\) が停留関数であることは、 \(y\) が極値関数であるための必要条件に相当することを利用して、極値関数の候補を絞り込みます。

1次変分を導出する例

より一般的な \((1)\) 式

$$I[y]=\int_a^b F(x,y(x),y'(x))dx$$

を例に、1次変分の一般形を導出してみます。

厳密性を求める人のための設定

導出にあたり、以下のことを仮定しておきます。

  • \(F(x,y,y')\) は \({\bf R}^3\) における開集合で3回連続微分可能
  • \({\bf I}\) に属する関数は有界な閉区間で連続微分可能
  • \({\bf I}\) に属する関数のグラフは \(F\) の定義域の内部に含まれる

つまり、これから色々足したり微分したりしますが、それが可能になるような条件を付けています。

1次変分と関数の変分の導出例

\(\eta(x)\) を区間 \([a,b]\) で連続微分可能な任意の関数、 \(\epsilon\) を微小な定数とします。

関数 \(y(x)\) に関数 \(\eta(x)\) をちょっと加えて形を変化させたことを

$$y\leftarrow y+\epsilon\eta$$

と表現します。このとき、 \(y'\) は

$$\frac{d}{dx}(y+\epsilon\eta)=y'+\epsilon\eta'$$

に変化します。

\(\epsilon\) が十分に小さいならば \(y+\epsilon\eta \in {\bf I}\) となるため、

$$I[y+\epsilon\eta]=\int_a^b F(x,y+\epsilon\eta,y'+\epsilon\eta')dx$$

が定義できます。

これは \(y,\eta\) を固定すると\(\epsilon\) の関数として見ることができ、

$$\Phi(\epsilon)=I[y+\epsilon\eta]$$

とおけます。

この関数を \(\epsilon\) で微分すると、微分の連鎖律により

$$\Phi'(\epsilon)=\int_a^b\left[\frac{\partial F}{\partial(y+\epsilon\eta)}(x,y+\epsilon\eta,y'+\epsilon\eta')\frac{\partial(y+\epsilon\eta)}{\partial\epsilon}+\frac{\partial F}{\partial(y'+\epsilon\eta')}(x,y+\epsilon\eta,y'+\epsilon\eta')\frac{\partial(y'+\epsilon\eta')}{\partial\epsilon}\right]dx$$

$$\Phi'(\epsilon)=\int_a^b[F_y(x,y+\epsilon\eta,y'+\epsilon\eta')\eta+F_{y'}(x,y+\epsilon\eta,y'+\epsilon\eta')\eta']dx\tag{2}$$

が導けます。ここで

$$\frac{\partial F}{\partial(y+\epsilon\eta)}(x,y+\epsilon\eta,y'+\epsilon\eta')=\frac{\partial F}{\partial y}(x,y,y')$$

であることを利用し、右辺を \(F_y\) と書きました。 \(F_{y'}\) についても同様です。

\(F_y,F_{y'}\) は連続であり、 \(\Phi'(\epsilon)\) は0の近傍で2回微分可能であることから、マクローリンの定理より、2次以上の項を \(o(\epsilon)\) とおいて、

$$\Phi(\epsilon)=\Phi(0)+\Phi'(0)\epsilon+o(\epsilon)$$

と表せます。

これはつまり、

$$\Phi(\epsilon)\sim\Phi(0)+\Phi'(0)$$

と近似できるということであり、

$$\Phi(\epsilon)=I[y+\epsilon\eta]\Leftrightarrow\Phi(0)=I[y]$$

であることを考え合わせると

$$I[y+\epsilon\eta]-I[y]\sim\Phi'(0)\epsilon$$

が成り立ちます。

この右辺を、汎関数 \(I\) の関数 \(y\) における1次変分といい、 \(\delta I[y]\) と書きます。

式 \((2)\) の内容を用いると

$$\delta I[y]=\Phi'(0)\epsilon$$

$$=\epsilon\int_a^b[F_y(x,y,y')\eta+F_{y'}(x,y,y')\eta']dx$$

$$=\epsilon\int_a^b[F_y(x,y,y')\epsilon\eta+F_{y'}(x,y,y')\epsilon\eta']dx$$

$$=\epsilon\int_a^b[F_y(x,y,y')\delta y+F_{y'}(x,y,y')\delta y']dx\tag{3}$$

と、1次変分が求まります。

途中、 \(\delta y=\epsilon\eta, \delta y'=\epsilon\eta'\) と書き換えましたが、これらをそれぞれ関数 \(y, y'\) の変分といいます。

変分の性質

1次変分 \(\delta I[y]\) は \(y\) の変分 \(\delta y\) にも依存するため、 \(\delta I[y]\) 自身も \(y,\delta y\) の汎関数になります。

これを \(I'[y,\delta y]\) で表すと、

$$\delta I[y]=I'[y,\delta y]$$

と書けます。

ここで \(y\) を固定すると \(I'[y,\delta y]\) は \(\delta y\) の汎関数として線形であると考えられます。

すなわち、 \(I'\) は \({\bf C}^1[a,b]\) (区間 \([a,b]\) で1回微分可能)において定義され、任意の \(\delta y_1,\delta y_2 \in {\bf C}^1[a,b]\) と任意の定数 \(c_1,c_2\) に対して

$$I'[y,c_1\delta y_1+c_2\delta y_2]=c_1I'[y,\delta y_1]+c_2I'[y,\delta y_2]$$

を満たします。

これは \((3)\) 式からすぐに確かめられます。

変分法の応用例

変分法・変分学の主な興味の対象は、与えられた汎関数を最大(極大)または最小(極小)にする関数を求めることにあります。

数学や物理学の重要問題の多くは多変数関数を含み、その解を求めるために変分法が利用される例は少なくありません。

変分法を使う例として、「正規分布の導出」を挙げておきます。

エントロピーの最大化による正規分布の導出
正規分布は「エントロピーを最大化する」という性質を持った確率分布であるため、統計学で重宝されています。この記事では、正規分布、エントロピー、確率密度関数の意味について確認し、これらを用いて正規分布を導出します。また、導出に際して汎関数や変分法についても解説します。

ここでも積分によって表される汎関数の変分 \(\delta I[p]\) を求め、

$$\delta I[p]=0$$

とおいて、エントロピーを最大化する確率密度関数を導出しています。

この例は被積分関数 \(F\) が導関数 \(p'\) に依存しない、すなわち

$$F(x,p,p')=F(x,p)$$

となるものですが、被積分関数が導関数に依存する場合は、オイラー方程式

$$\frac{\partial f}{\partial y}-\frac{d}{dx}\left(\frac{\partial f}{\partial y'}\right)$$

を活用して解を求める場合が多いです。

Comments