“The Separation Plot” in Python | USHITORA Lab.
スポンサーリンク

“The Separation Plot” in Python

Python

Pythonで作成したプログラムに「The Separation Plot」を実装するコードを作成した。

ついでに「Brier Scores」と「Expected PCP(ePCP)」も導入できるようにした。

Brier Scores

$$B = \frac{1}{N}\sum_{}^{}{(p – X)^2}$$

Expected PCP(ePCP)

$$ePCP = \frac{1}{N}(\sum_{y_i=1}^{}{p_i} + \sum_{y_i=1}^{}{(1 – p_i)})$$

The Separation Plot

緑線(長方形) … ラベルが1となるデータを表示

白線(長方形) … ラベルが0となるデータを表示

黒曲線 … 各データの予測確率を表示

赤線 … Expected Number of Events(ENoE)を表示。右からENoE番目の長方形のすぐ左にくる。

詳しくは元論文のJournal Clubを参照のこと。

使い方

actual_outcome : 実際のラベルyを格納したlist型変数(1次元)。

fitted_value : 予測確率pを格納したlist型変数(1次元)。

以上の引数を与えてください。コードの利用にはnumpy, pandasが必要です。

コメント