パラメトリック検定(t検定、F検定、分散分析)

パラメトリック検定

母集団のデータが正規分布していると仮定し、平均値や分散などのパラメータを使うことで、実験仮説を検証していく方法をパラメトリック検定と言います。
ランダムに抽出された1つの観測値(標本)が特定の値をとる確率は、その母集団が正規分布する場合には、それを比較できるように変換し、標準正規分布の確率密度に当てはめて推定します。

t検定

これと同様に、標本平均がある値をとる確率についても、平均値の標本分布が分かれば、これを利用して推定することができます。

標本データの分布ではなく、標本の平均値の分布を考えた場合、正規分布している母集団から複数の標本を取り出して標本平均を計算する、ということを繰り返すと、複数の平均値が得られますが、この平均値の集まりを別の母集団として分布を調べると最初の母集団と同様に正規分布することが知られています。
ただし、得られることが分かっている分布の理論値には、本来知りえない母標準偏差に関する値が含まれているため、それを標本データから推測しようとすると、正規分布とは少し異なる分布になることが分かっています。それがt分布です。

2つの標本の平均間に差があるかどうかの検定では、このt分布との比較によって検討を進めていきます。
t分布において自由度と任意の信頼区間から数値を探しだすことでtの値が分かり、それを用いることで任意の信頼区間における母平均が幅をもって推定できます。
これを応用して、母平均の値が0、つまり各々の標本は同じ母集団から由来すると母平均を先に仮定してtの値を求め、その値が任意の信頼区間に入るかチェックすることで、2群の平均に差があるかを検討するのです。

2つの標本を比較しようとした場合には、その標本が、同一被験者を異なる条件下で繰り返して観察・測定するような場合や、異なる被験者であっても同一条件かで測定すれば従属変数の値が等しくなるような類似した特性を持つ被験者の「対(ペア)」をつくり、対になった2人を別々の条件に無作為に割り当てるような場合には、2つの標本に対応があるとしてそれにあった検定を進めていきます。
一方で、2つの標本に対応がない、2つの独立した平均値の差を検討する場合には、それにあった方法で検定を進めていく事になります。

F検定

t分布と同じような考え方で、2つの分散の比に関してはF分布が得られています。
F分布を用いることで、比較する標本間の分散が等しいか等しくないかを調べる事ができます。

分散分析

3つ以上の平均値を比較する場合に、すべての平均値を単純に2つずつ組み合わせてt検定を繰り返すという形をとると、全体の有意水準を不当に大きくして帰無仮説を棄却しやすくしてしまいます。
そのため、3つ以上の平均値の有意差を検討する場合には、まず3つ、もしくはそれ以上の平均値のすべてが等しいかどうかを全体として調べます。そして、等しくない時には有意差なしと結論し、等しくない場合つまり有意差ありとなったときのみ、どの平均対の間に差があるかを調べます。このように3つ以上の平均値の有意差の検定には、分散分析が用いられます。

例えば、明るさの程度(低・中・高)が作業能率に影響を及ぼすかどうかを調べたい場合などに分散分析が用いられます。この場合、独立変数である明るさのことを要因と呼び、要因の中に設定される低・中・高という段階を水準と呼びます。

分散分析では、その名前の通り、分散を分析することで仮説を検証していきます。
各データの平均との差を二乗したものを足したものを平方和と呼びますが、要因が1つの1要因分散分析では、データ全体の平方和が、要因を原因とする要因平方和と、それ以外の原因による誤差平方和に分解されます。
平方和を自由度で割った平均平方和、要因の平均平方を誤差の平均平方で割った分散比などとともに、得られた結果は分散分析表にまとめられ、分散比をF分布に照らして検定がなされます。
こうして3つ以上の平均値の間に全体として有意差がみられたとしても、必ずしもすべての平均の間に有意な差がある事は示していません。そこで、様々な多重比較によって各々の平均値のどれとどれの間に差があるのかを調べていくことになります。

要因が2つある2要因分散分析では、2つの要因各々の主効果とその2つの要因間の交互作用が検討されます。

参考文献

  • 服部環・海保博之 1996 Q&A 心理データ解析 福村出版
  • 池田郁男 2013 統計検定を理解せずに使っている人のためにⅠ 化学と生物51(5) p.318-525
  • 池田郁男 2013 統計検定を理解せずに使っている人のためにⅡ 化学と生物51(6) p.408-417
  • 池田郁男 2013 統計検定を理解せずに使っている人のためにⅢ 化学と生物51(7) p.408-417
  • 大村平 1980 統計解析のはなし データに語らせるテクニック 日科技連
  • 山上暁・佐倉佐一(編著) 2003 新版 要説 心理統計法 北大路書房