相関係数(そうかんけいすう、英: correlation coefficient)とは、2つのデータまたは確率変数の間にある線形な関係の強弱を測る指標である[1][2]。相関係数は無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという[3][4]。
たとえば、先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば−1に近い数字になる。
相関係数が ±1 に値をとることは、2つのデータ(確率変数)が線形の関係にあるときに限る[5]。また2つの確率変数が互いに独立ならば相関係数は 0 となるが、逆は成り立たない。
普通、単に相関係数といえばピアソンの積率相関係数を指す[6]。ピアソン積率相関係数の検定は偏差の正規分布を仮定する(パラメトリック)方法である[7]が、他にこのような仮定を置かないノンパラメトリックな方法として、スピアマンの順位相関係数、ケンドールの順位相関係数なども一般に用いられる[8][9]。 日本産業規格では、相関(そうかん:correlation)を、「二つの確率変数の分布法則の関係。多くの場合,線形関係の程度を指す。」と定義している[10]。 正の分散を持つ確率変数 X, Y が与えられたとき、共分散を cov [ X , Y ] {\displaystyle \operatorname {cov} [X,Y]} 、標準偏差を σX, σY とおく。このとき ρ = cov [ X , Y ] σ X σ Y {\displaystyle \rho ={\frac {\operatorname {cov} [X,Y]}{\sigma _{X}\sigma _{Y}}}} を確率変数 X と Y の相関係数という。これは期待値を E[…] で表せば ρ = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] E [ ( X − E [ X ] ) 2 ] E [ ( Y − E [ Y ] ) 2 ] {\displaystyle \rho ={\frac {E\left[\left(X-E\left[X\right]\right)\left(Y-E\left[Y\right]\right)\right]}{\sqrt {E\left[\left(X-E\left[X\right]\right)^{2}\right]E\left[\left(Y-E\left[Y\right]\right)^{2}\right]}}}} と書き直すこともできる。 大きさの同じ2個のデータ (x1, x2, …, xn), (y1, y2, …, yn) に対して、標本共分散を sxy、標本標準偏差をそれぞれ sx, sy とおく。このとき r := s x y s x s y = ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) ∑ i = 1 n ( x i − x ¯ ) 2 ∑ i = 1 n ( y i − y ¯ ) 2 {\displaystyle r:={\frac {s_{xy}}{s_{x}s_{y}}}={\frac {\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)\left(y_{i}-{\overline {y}}\right)}{\sqrt {\sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\sum \limits _{i=1}^{n}(y_{i}-{\overline {y}})^{2}}}}} を標本相関係数 (sample correlation coefficient) あるいはピアソンの積率相関係数という。ただし、x, y はそれぞれデータ (x1, x2, …, xn), (y1, y2, …, yn) の平均値で、 x ¯ = 1 n ∑ i = 1 n x i {\displaystyle {\overline {x}}={\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}x_{i}} , y ¯ = 1 n ∑ i = 1 n y i {\displaystyle {\overline {y}}={\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}y_{i}} である。 相関係数は、幾何学的には次のような意味になる。 データ (x1, x2, …, xn), (y1, y2, …, yn) をそれぞれ n 次の列ベクトル x = [x1 x2 ... xn]⊤, y = [y1 y2 ... yn]⊤ と考えると、x, y の偏差ベクトルはそれぞれ以下のようになる。
定義
相関
相関係数
母集団相関係数.mw-parser-output .ambox{border:1px solid #a2a9b1;border-left:10px solid #36c;background-color:#fbfbfb;box-sizing:border-box}.mw-parser-output .ambox+link+.ambox,.mw-parser-output .ambox+link+style+.ambox,.mw-parser-output .ambox+link+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+style+.ambox,.mw-parser-output .ambox+.mw-empty-elt+link+link+.ambox{margin-top:-1px}html body.mediawiki .mw-parser-output .ambox.mbox-small-left{margin:4px 1em 4px 0;overflow:hidden;width:238px;border-collapse:collapse;font-size:88%;line-height:1.25em}.mw-parser-output .ambox-speedy{border-left:10px solid #b32424;background-color:#fee7e6}.mw-parser-output .ambox-delete{border-left:10px solid #b32424}.mw-parser-output .ambox-content{border-left:10px solid #f28500}.mw-parser-output .ambox-style{border-left:10px solid #fc3}.mw-parser-output .ambox-move{border-left:10px solid #9932cc}.mw-parser-output .ambox-protection{border-left:10px solid #a2a9b1}.mw-parser-output .ambox .mbox-text{border:none;padding:0.25em 0.5em;width:100%;font-size:90%}.mw-parser-output .ambox .mbox-image{border:none;padding:2px 0 2px 0.5em;text-align:center}.mw-parser-output .ambox .mbox-imageright{border:none;padding:2px 0.5em 2px 0;text-align:center}.mw-parser-output .ambox .mbox-empty-cell{border:none;padding:0;width:1px}.mw-parser-output .ambox .mbox-image-div{width:52px}html.client-js body.skin-minerva .mw-parser-output .mbox-text-span{margin-left:23px!important}@media(min-width:720px){.mw-parser-output .ambox{margin:0 10%}}が望まれています。
標本相関係数
Size:54 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef