「関数の関数」と呼ばれる汎関数と、汎関数を最大化(最小化)する変分法について解説します。
汎関数は通常の「関数-引数」の関係を、「汎関数-関数」の関係にそのまま置き換えることで簡単に理解できます。
同様に変分法も、極値を極値関数に置き換えたものと大差ありません。
汎関数の定義と例
あえて難しく、厳密に定義する
のちほど噛み砕いて説明しますが、いちおう厳密(な感じ)に汎関数を定義しておきます。
まず、関数の集合のことを関数族といいます。
そのうえで、汎関数は以下のように定義されます。
\({\bf I}\) を関数族とし、おのおのの関数 \(y \in {\bf I}\) に1つの数値 \(I[y]\) が対応しているとき、
この対応を与える \(I\) を汎関数という。
なお、関数と区別するために、汎関数 \(I\) の括弧には \([\quad]\) を使用します。
数式を使ったイメージ
上記で言っていることは、ほとんど関数の性質と同じです。
関数 \(y(x)\) は変数 \(x\) によって値が決まり、これは「変数に1つの数値が対応している」と表現できます。
つまり、変数 \(x\) の関数である \(y(x)\) の値が変数 \(x\) に依存するのと同様に、
関数 \(y\) の汎関数である \(I[y]\) の値は関数 \(y\) に依存する、ということです。
関数の「値に」依存するのではないことに注意。
正しくは、関数の形・種類に依存するイメージ
汎関数の例
汎関数の代表的な例としては、定積分
$$I[y]=\int_a^b y(x)dx$$
が挙げられます。ここでも \(y\) は変数 \(x\) の関数です。
\(y’\) を \(y\) 導関数とし、 \(F\) を \(x,y,y’\) を用いて定義される関数とすると、
$$I[y]=\int_a^b F(x,y(x),y'(x))dx \tag{1}$$
も汎関数になります。
なぜならば、導関数 \(y’\) は関数 \(y\) によって定まり、その結果、 \(F, I\) も \(y\) によって定まるためです。
このように、汎関数は関数とその導関数を含めて表現することができます。
変分法の意味と計算例
変分法の意味と、やりたいことのイメージ
変分法とは、汎関数 \(I[y]\) を最大(極大)または最小(極小)にする極値関数 \(y^*(x)\) を求めるための手法です。
その原理は、関数 \(f(x)\) が最大(極大)または最小(極小)となる点において1次導関数 \(f'(x)=0\) がとなることを利用する手法に似ています。
具体的には、汎関数の場合は1次変分 \(\delta I[y]\) を求めて
$$\delta I[y]=0$$
とおきます。
これをみたす(1次変分をゼロにする)関数 \(y_0\) のことを停留関数、また、このときの \(I\) の値を停留値といいます。
\(y\) が停留関数であることは、 \(y\) が極値関数であるための必要条件に相当することを利用して、極値関数の候補を絞り込みます。
1次変分を導出する例
より一般的な \((1)\) 式
$$I[y]=\int_a^b F(x,y(x),y'(x))dx$$
を例に、1次変分の一般形を導出してみます。
厳密性を求める人のための設定
導出にあたり、以下のことを仮定しておきます。
- \(F(x,y,y’)\) は \({\bf R}^3\) における開集合で3回連続微分可能
- \({\bf I}\) に属する関数は有界な閉区間で連続微分可能
- \({\bf I}\) に属する関数のグラフは \(F\) の定義域の内部に含まれる
つまり、これから色々足したり微分したりしますが、それが可能になるような条件を付けています。
1次変分と関数の変分の導出例
\(\eta(x)\) を区間 \([a,b]\) で連続微分可能な任意の関数、 \(\epsilon\) を微小な定数とします。
関数 \(y(x)\) に関数 \(\eta(x)\) をちょっと加えて形を変化させたことを
$$y\leftarrow y+\epsilon\eta$$
と表現します。このとき、 \(y’\) は
$$\frac{d}{dx}(y+\epsilon\eta)=y’+\epsilon\eta’$$
に変化します。
\(\epsilon\) が十分に小さいならば \(y+\epsilon\eta \in {\bf I}\) となるため、
$$I[y+\epsilon\eta]=\int_a^b F(x,y+\epsilon\eta,y’+\epsilon\eta’)dx$$
が定義できます。
これは \(y,\eta\) を固定すると\(\epsilon\) の関数として見ることができ、
$$\Phi(\epsilon)=I[y+\epsilon\eta]$$
とおけます。
この関数を \(\epsilon\) で微分すると、微分の連鎖律により
$$\Phi'(\epsilon)=\int_a^b\left[\frac{\partial F}{\partial(y+\epsilon\eta)}(x,y+\epsilon\eta,y’+\epsilon\eta’)\frac{\partial(y+\epsilon\eta)}{\partial\epsilon}+\frac{\partial F}{\partial(y’+\epsilon\eta’)}(x,y+\epsilon\eta,y’+\epsilon\eta’)\frac{\partial(y’+\epsilon\eta’)}{\partial\epsilon}\right]dx$$
$$\Phi'(\epsilon)=\int_a^b[F_y(x,y+\epsilon\eta,y’+\epsilon\eta’)\eta+F_{y’}(x,y+\epsilon\eta,y’+\epsilon\eta’)\eta’]dx\tag{2}$$
が導けます。ここで
$$\frac{\partial F}{\partial(y+\epsilon\eta)}(x,y+\epsilon\eta,y’+\epsilon\eta’)=\frac{\partial F}{\partial y}(x,y,y’)$$
であることを利用し、右辺を \(F_y\) と書きました。 \(F_{y’}\) についても同様です。
\(F_y,F_{y’}\) は連続であり、 \(\Phi'(\epsilon)\) は0の近傍で2回微分可能であることから、マクローリンの定理より、2次以上の項を \(o(\epsilon)\) とおいて、
$$\Phi(\epsilon)=\Phi(0)+\Phi'(0)\epsilon+o(\epsilon)$$
と表せます。
これはつまり、
$$\Phi(\epsilon)\sim\Phi(0)+\Phi'(0)$$
と近似できるということであり、
$$\Phi(\epsilon)=I[y+\epsilon\eta]\Leftrightarrow\Phi(0)=I[y]$$
であることを考え合わせると
$$I[y+\epsilon\eta]-I[y]\sim\Phi'(0)\epsilon$$
が成り立ちます。
この右辺を、汎関数 \(I\) の関数 \(y\) における1次変分といい、 \(\delta I[y]\) と書きます。
式 \((2)\) の内容を用いると
$$\delta I[y]=\Phi'(0)\epsilon$$
$$=\epsilon\int_a^b[F_y(x,y,y’)\eta+F_{y’}(x,y,y’)\eta’]dx$$
$$=\int_a^b[F_y(x,y,y’)\epsilon\eta+F_{y’}(x,y,y’)\epsilon\eta’]dx$$
$$=\int_a^b[F_y(x,y,y’)\delta y+F_{y’}(x,y,y’)\delta y’]dx\tag{3}$$
と、1次変分が求まります。
途中、 \(\delta y=\epsilon\eta, \delta y’=\epsilon\eta’\) と書き換えましたが、これらをそれぞれ関数 \(y, y’\) の変分といいます。
変分の性質
1次変分 \(\delta I[y]\) は \(y\) の変分 \(\delta y\) にも依存するため、 \(\delta I[y]\) 自身も \(y,\delta y\) の汎関数になります。
これを \(I'[y,\delta y]\) で表すと、
$$\delta I[y]=I'[y,\delta y]$$
と書けます。
ここで \(y\) を固定すると \(I'[y,\delta y]\) は \(\delta y\) の汎関数として線形であると考えられます。
すなわち、 \(I’\) は \({\bf C}^1[a,b]\) (区間 \([a,b]\) で1回微分可能)において定義され、任意の \(\delta y_1,\delta y_2 \in {\bf C}^1[a,b]\) と任意の定数 \(c_1,c_2\) に対して
$$I'[y,c_1\delta y_1+c_2\delta y_2]=c_1I'[y,\delta y_1]+c_2I'[y,\delta y_2]$$
を満たします。
これは \((3)\) 式からすぐに確かめられます。
変分法の応用例
変分法・変分学の主な興味の対象は、与えられた汎関数を最大(極大)または最小(極小)にする関数を求めることにあります。
数学や物理学の重要問題の多くは多変数関数を含み、その解を求めるために変分法が利用される例は少なくありません。
変分法を使う例として、「正規分布の導出」を挙げておきます。
ここでも積分によって表される汎関数の変分 \(\delta I[p]\) を求め、
$$\delta I[p]=0$$
とおいて、エントロピーを最大化する確率密度関数を導出しています。
この例は被積分関数 \(F\) が導関数 \(p’\) に依存しない、すなわち
$$F(x,p,p’)=F(x,p)$$
となるものですが、被積分関数が導関数に依存する場合は、オイラー方程式
$$\frac{\partial f}{\partial y}-\frac{d}{dx}\left(\frac{\partial f}{\partial y’}\right)$$
を活用して解を求める場合が多いです。
もっと知りたいこと、感想を教えてください!