環境統計学  第7回

2003年5月29日  大塚泰介

1.事前比較・事後比較、多重性

 統計的検定において、対立仮説は実験・調査の計画段階で決定されなければならない。
その理由は、得られた測定値を様々な基準で分け直して何回も解析する場合を考えるとわかりやすい。まず、一つの母集団からランダム・サンプリングによって得られた標本の各測定値を、ランダムに2群に分け、測定値に差があるかどうかを検定したとする。当然、この2群のデータは同じ母集団からランダム・サンプリングによって得られたものなので、危険率5%以下の場合に有意差を認めるとすれば、有意差が検出される可能性は5%である。それでは、同じ標本をランダムに2群に分けて検定する、という操作を20回繰り返した場合、有意差が検出される可能性はどれくらいあるだろうか。有意差が検出される回数の期待値は0.05×20 = 1、すなわち、20回検定を繰り返すと平均して1回、有意差が検出されるのである。そして、1回以上有意差が検出される確率は1 - (0.95)20≓ 0.64、つまり約64%もある。すなわち、20回の標本の分けなおしを行ったうちで、最も差が大きかったときの分け方について差を検定したときには、2群の標本が同じ母集団から抽出されたにもかかわらず、有意差が検出される可能性は約64%もあるのである。

 このような多重性の問題が生じるのを防ぐために、何と何との違いを検定するのかを実験・調査の計画段階で予め確定しておく必要があるのである。このように実験・調査の前に計画された比較を事前比較という。これに対して、データを見てから行われる比較を事後比較という。
 どうしても事後比較を行わなければならない場合、あるいは事前比較でもデータをいくつかの異なる基準で分けて検定を繰り返す場合には、多重性の問題を回避するために、事前比較で1回だけ検定を行う場合とは異なる基準を用いなければならない。そのための方法の1つに Sidak の方法がある。これは、それぞれの検定結果が互いに独立であることがわかっている場合に、n回検定を繰り返した場合に1回以上有意差が検出される確率が5%になる確率、すなわち
1 - (1-α)n = 0.05
となるαを、有意差を検出するための危険率の基準とする方法である。

2.片側検定と両側検定(教科書p.67〜70)

ここまでで扱ってきた検定では常に、統計量が実測されたのと反対側に偏る可能性を考慮してきた。事前比較を建前とする以上、対立仮説を設定した段階では統計量がどちらに偏るか分からないためである。このように、統計量が大小どちらに偏る可能性も同様に考えた上で行う検定方法を、両側検定という。

 しかし実際には、実験・調査の計画段階で、統計量が偏る方向が十分に予測できる場合もある。たとえば第3回の練習4で扱ったカワムツとオイカワの側線鱗数の例では、多くの研究者が既にオイカワの側線鱗数のほうが少ない傾向があることを指摘しており、その反対の記述は見当たらない。また、第4回の例題7および第5回の例題9で扱った、落語を聞く前後でのNK細胞活性比較の例では、これに先だって吉本新喜劇を見たガン患者のNK細胞活性が上がるという報告がなされている。こうした場合、それぞれ「カワムツの側線鱗数がオイカワより少ない傾向がある」「落語を聞くとNK細胞活性が下がる」という可能性はかなり低い。もし、こうした可能性を経験的、あるいは論理的に排除できるならば、仮説は次のように変わってくることになる。

カワムツとオイカワの側線鱗数の場合
両側検定での対立仮説
H1:カワムツとオイカワの側線鱗数には、どちらかが多い傾向がある。
H0:カワムツとオイカワの側線鱗数には、どちらが多い傾向もない(帰無仮説)

「カワムツの側線鱗数がオイカワより少ない傾向がある」可能性を排除した場合の対立仮説
H1:カワムツの側線鱗数はオイカワよりも多い傾向がある
H0:カワムツとオイカワの側線鱗数には、どちらが多い傾向もない(帰無仮説)

落語を聞く前後でのNK細胞活性の比較の場合
両側検定での対立仮説
H1:落語を聞いた後にNK細胞の活性が上昇または下降する傾向がある。
H0:落語を聞いた後に生じるNK細胞の活性変化に傾向性はない(帰無仮説)

「落語を聞くとNK細胞活性が下がる」可能性を排除した場合の対立仮説
H1:落語を聞いた後にNK細胞の活性が上昇する傾向がある。
H0:落語を聞いた後に生じるNK細胞の活性変化に傾向性はない(帰無仮説)

 このように、統計量が予測される方向の反対に偏る可能性を排除した上で行う仮説検定を、片側検定という。
 片側検定の危険率P は一般に、両側検定の1/2になる。これは両側検定においてP = 0.08で帰無仮説が棄却できなかった場合でも、片側検定ではP = 0.04で帰無仮説を棄却できることを意味する。したがって、片側検定の検出力は両側検定より高い。

 以下の場合に、片側検定を用いることができる。
A. 統計量が一方に偏る可能性が、経験的あるいは論理的に十分な根拠をもって排除できる場合。ただし、その根拠が覆されると検定の妥当性そのものが失われるので、根拠不十分な場合には両側検定にしておいた方がよい。
B. 統計量が一方に偏ることの意味が、その反対に偏るのと根本的に異なる場合。例として、分割表に対するχ2 検定(後に学習する)を挙げておく。この検定において、統計量が大きな値をとる場合には、2つの類別変数に連関がある可能性が高い。逆に著しく小さな値をとる場合には、2つの類別変数に連関がない上で起こった単なる偶然か、ランダム・サンプリングが行われなかったかのいずれかである。

本日のキーワード:事前比較、事後比較、多重性、両側検定、片側検定
第8回へ→

←トップ頁へ