決定係数
[Wikipedia|▼Menu]

決定係数(けっていけいすう、(: coefficient of determination、R2)は、統計学において、独立変数(説明変数)が従属変数(目的変数)のどれくらいを説明できるかを表す値である。寄与率と呼ばれることもある。標本値から求めた回帰方程式(モデル)のあてはまりの良さの尺度として利用される。
定義
一般的な定義

決定係数 R 2 {\displaystyle R^{2}} のはっきりと合意された定義は無い。タロル・クヴォルセス[1]によれば、8種類の定義があり注意が必要だとしている[2]。しかし、以下の式を定義とするのが一般的なようである。標本値(実測値、観測値)を y = { y 1 ,   y 2 ,   ⋯ ,   y N } {\displaystyle y=\left\{y_{1},\ y_{2},\ \cdots ,\ y_{N}\right\}} 、回帰方程式による推定値を f = { f 1 ,   f 2 ,   ⋯ ,   f N } {\displaystyle f=\left\{f_{1},\ f_{2},\ \cdots ,\ f_{N}\right\}} とする。 R 2 ≡ 1 − ∑ i = 1 N ( y i − f i ) 2 ∑ j = 1 N ( y j − y ¯ ) 2 {\displaystyle R^{2}\equiv 1-{\frac {\displaystyle \sum _{i=1}^{N}\left(y_{i}-f_{i}\right)^{2}}{\displaystyle \sum _{j=1}^{N}\left(y_{j}-{\overline {y}}\right)^{2}}}}

すなわち、残差の二乗和を標本値の平均値 y ¯ {\displaystyle {\overline {y}}} からの偏差の二乗和で割ったものを1から引いた値であり、1に近い程相対的な残差が少ないことを表す。最小二乗法はこの定義を最大にするようなパラメータの選択法である。値域は1以下の実数。よく見かける値は0?1のあたり。

回帰方程式が最小二乗法による単回帰の回帰直線の場合は、決定係数はピアソンの積率相関係数の2乗になり、0以上1以下の実数になる。

なお、一般的な線形回帰の場合、以下の各式が等価であり、それらを定義式とすることもあるようである。
推定値の分散を標本値の分散で割ったもの
R 2 ≡ ∑ i = 1 N ( f i − f ¯ ) 2 ∑ j = 1 N ( y j − y ¯ ) 2 {\displaystyle R^{2}\equiv {\frac {\displaystyle \sum _{i=1}^{N}\left(f_{i}-{\overline {f}}\right)^{2}}{\displaystyle \sum _{j=1}^{N}\left(y_{j}-{\overline {y}}\right)^{2}}}}
標本値と推定値との相関係数の2乗
R 2 ≡ { ∑ i = 1 N ( f i − f ¯ ) ( y i − y ¯ ) } 2 { ∑ j = 1 N ( f j − f ¯ ) 2 } { ∑ k = 1 N ( y k − y ¯ ) 2 } {\displaystyle R^{2}\equiv {\frac {\left\{\displaystyle \sum _{i=1}^{N}\left(f_{i}-{\overline {f}}\right)\left(y_{i}-{\overline {y}}\right)\right\}^{2}}{\left\{\displaystyle \sum _{j=1}^{N}\left(f_{j}-{\overline {f}}\right)^{2}\right\}\left\{\displaystyle \sum _{k=1}^{N}\left(y_{k}-{\overline {y}}\right)^{2}\right\}}}}

線形回帰以外の場合、原点を通ることを要求した場合、最小二乗法以外で回帰した場合はこれらの式は上の定義と等価になるとは限らないため、注意が必要である。
クヴォルセスによる8つの定義

クヴォルセスによる8つの定義は以下の通りである。

名前定義
R 1 2 {\displaystyle R_{1}^{2}} 1 − ∑ i = 1 N ( y i − f i ) 2 ∑ j = 1 N ( y j − y ¯ ) 2 {\displaystyle 1-{\frac {\displaystyle \sum _{i=1}^{N}\left(y_{i}-f_{i}\right)^{2}}{\displaystyle \sum _{j=1}^{N}\left(y_{j}-{\overline {y}}\right)^{2}}}}
R 2 2 {\displaystyle R_{2}^{2}} ∑ i = 1 N ( f i − y ¯ ) 2 ∑ j = 1 N ( y j − y ¯ ) 2 {\displaystyle {\frac {\displaystyle \sum _{i=1}^{N}\left(f_{i}-{\overline {y}}\right)^{2}}{\displaystyle \sum _{j=1}^{N}\left(y_{j}-{\overline {y}}\right)^{2}}}}
R 3 2 {\displaystyle R_{3}^{2}} ∑ i = 1 N ( f i − f ¯ ) 2 ∑ j = 1 N ( y j − y ¯ ) 2 {\displaystyle {\frac {\displaystyle \sum _{i=1}^{N}\left(f_{i}-{\overline {f}}\right)^{2}}{\displaystyle \sum _{j=1}^{N}\left(y_{j}-{\overline {y}}\right)^{2}}}}


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:48 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef