テューキーの範囲検定(テューキーのはんいけんてい、英: Tukey's range test)は、一段階(シングルステップ)多重比較法ならびに統計検定の一種である。テューキーの範囲検定、テューキー法、テューキーのHSD (honestly significant difference) 検定としても知られている[1]。名称はジョン・テューキーに因む[2]。テューキー法では全ての可能な平均
の対を比較し、「スチューデント化された範囲分布(英語版)」(q) を用いる(この分布はt検定に用いられるt分布に似ている)[3]。テューキーのHSD検定は、テューキーの平均差検定(ブランド=アルトマン検定としても知られている)と混同してはならない。テューキーの検定は、全ての処理の平均をその他全ての処理の平均と比較する。つまり、全ての一対比較の組 μ i − μ j {\displaystyle \mu _{i}-\mu _{j}\,}
に同時に適用され、期待される標準誤差よりも大きな2つの平均の間の差を特定する。全ての標本の大きさが等しい時、この集合に対する信頼係数は厳密に1 − αである。標本の大きさが等しくない場合、信頼係数は1 − αより大きくなる。言い換えれば、テューキー法は標本の大きさが等しくない場合は保守的である。
よくある誤解として分散分析(ANOVA)で有意差があった(全ての群が同じ母集団から来ているという帰無仮説を棄却した)後に、テューキーの検定といった多重比較を行うべき、というものがある。しかし、分散分析で有意差が認められなくても、多重比較で群間に有意差が認められることはありうるため、群間の比較に興味がある時は多重比較の前に分散分析を行うべきではない。
元々はサンプルサイズが等しいときの方法がテューキーの方法と呼ばれており、サンプルサイズが等しくない場合に拡張したものがテューキー・クレーマーの方法である[4]。サンプルサイズが等しい場合、最大タイプIファミリーワイズエラー率は有意水準αと一致する[4]。サンプルサイズが等しくない場合にも、最大タイプIファミリーワイズエラー率がα以下になることが証明されている[4]。 テューキーの検定はt検定とよく似た式に基づいている。実際、テューキーの検定は実験あたりの過誤率(experiment-wise error rate)を補正することを除けば本質的にt検定である(多重比較
テューキーの検定の仮定
検定される観測は独立である。
母集団分布は正規分布である[5]。
検定におけるそれぞれの平均と関連した群の全域で群内分散が等しい(等分散性)[5]。
検定統計量
テューキーの検定の式は以下の通りである。 q s = Y A − Y B S E , {\displaystyle q_{s}={\frac {Y_{A}-Y_{B}}{SE}},}
YAは比較する2つの平均のより大きいもの、YBは比較する2つの平均のより小さなもの、SEは問題になっているデータの標準誤差である。
このqsは次に、「スチューデント化された範囲」の分布からのq値と比較される。qsがスチューデント化された範囲の分布から得られたqcritical値よりも「大きい」場合は、2つの平均間に有意差があると考えられる[3]。
テューキーの検定の帰無仮説は、比較される全ての平均が同じ母集団に属する(すなわちμ1 = μ2 = μ3 = ... = μn)というものであるため、(中心極限定理により)平均は正規分布しなければならない。これによりテューキーの検定のnormality assumption(誤差は正規分布に従うという仮定)が生じる。 少なくとも1 − αの信頼係数を持つ全ての一対比較に対するテューキーの信頼限界は y ¯ i ∙ − y ¯ j ∙ ± q α ; r ; N − r 2 σ ^ ε 2 n i , j = 1 , … , r i ≠ j . {\displaystyle {\bar {y}}_{i\bullet }-{\bar {y}}_{j\bullet }\pm {\frac {q_{\alpha ;r;N-r}}{\sqrt {2}}}{\widehat {\sigma }}_{\varepsilon }{\sqrt {\frac {2}{n}}}\qquad i,j=1,\ldots ,r\quad i\neq j.} である。点推定量および推定分散は、単一の一対比較に対するものと同じである。同時比較に対する信頼限界と単一比較に対する信頼限界との間の唯一の違いは、推定標準偏差の多重度である。 スチューデント化された範囲分布を用いる時には、標本サイズは等しくなければならない。 σ ^ ε {\displaystyle {\widehat {\sigma }}_{\varepsilon }} は比較する2群のみの標準偏差ではなく、全配置の標準偏差である。異なる標本サイズに対するテューキー・クレーマー法は以下の通りである。 y ¯ i ∙ − y ¯ j ∙ ± q α ; r ; N − r 2 σ ^ ε 1 n i + 1 n j {\displaystyle {\bar {y}}_{i\bullet }-{\bar {y}}_{j\bullet }\pm {\frac {q_{\alpha ;r;N-r}}{\sqrt {2}}}{\widehat {\sigma }}_{\varepsilon }{\sqrt {{\frac {1}{n}}_{i}+{\frac {1}{n}}_{j}}}\qquad } n iおよびn jはそれぞれ群iおよびjのサイズである。全配置の自由度も適用される。 テューキー法はスチューデント化された範囲分布を用いる。平均μ、分散σ2の正規分布からr回の独立した観測y1, ..., yrを行うと仮定する。wをこの組の範囲、すなわち最大引く最小とする。ここで、ν自由度に基づきyi (i = 1,...,r) から独立している分散σ2の推定値s2を仮定する。スチューデント化された範囲は q r , ν = w / s {\displaystyle q_{r,\nu }=w/s\,} と定義される。 テューキーの検定は同じ母集団からの2つの標本の比較に基づく。最初の標本から、範囲 qのこの値はqの臨界値の基礎であり、3つの因子に基づく。 qの分布は多くの統計の教科書に表で掲載されている。加えてRにはqのための累積分布関数 (ptukey) および分位関数 (qtukey) が含まれている。 A > B > C > Dと順位付けされる一組の平均(A, B, C, D)がある時、全ての可能の比較をテューキーの検定を用いて検定する必要はない。冗長性を回避するため、まず最大の平均(A)と最小の平均(D)の比較から始める。
信頼限界
スチューデント化された範囲 (q) 分布
α(第一種過誤の度合い: 帰無仮説を棄却してしまう確率)
n(最初の標本の自由度の数)
v(2つ目の標本の自由度の数)
比較の順序