環境統計学  第12回

2003年7月3日  大塚泰介

1.χ2検定の基礎(教科書p.78〜80)

 類別データの頻度分布が,期待値周辺での偶然誤差(ランダム・サンプリングで生じる誤差)の範囲内であるかどうかを検定する際に,しばしばχ2検定(カイ二乗検定)を行う。
 といってもピンと来ないだろうから,まずは例題から入る。

例題19:前回と同じ材料を用いる。藤川 (1973) はあるシバ型草地において,一様にシバが繁茂するように見える50 cm×60 cm の区画をとり,これを5 cm×4 cmの小区画150個に区切った。そしてそれぞれの小区画で深さ 5 cm までの土壌を採取し,その中からツルグレン装置によって動物を分離した。ここでは,その中から9区画をランダムに抽出し,それぞれに含まれていたササラダニ類(成体+ニンフ)の個体数を示す。
個体数:28, 9, 17, 9, 14, 23, 3, 16, 23
これが草地内からのランダム・サンプリングであると見なせるとして,ササラダニ類はこのシバ型草地内で集中分布をしていたと言えるか。

 まずは対立仮説を立てる。
H1:ササラダニ類は草地内で集中分布をしていた。
H0:ササラダニ類は草地内でランダム分布をしていた。

 実はもう1つ「ササラダニ類は草地内で一様分布をしていた」という可能性もある。しかしササラダニ類がなわばりをつくって同種の他個体を排斥するという話は聞いたことがないので,一様分布になる可能性は考えなくても良いだろう。そこで片側検定を行えば良いことになる。

 もしササラダニ類が草地内でランダム分布をしていたとすれば,各小区画から計数された個体数はポアソン分布に従う。ポアソン分布は期待値μと母分散σ2が等しい分布なので,標本から計算された平均 m と不偏分散 s2 もだいたい等しくなる。一方で集中分布をしていた場合には,ランダム分布の場合よりも小区画間のばらつきが大きい,すなわち分散が大きくなるので,ms2となるはずである。
前回計算した通り,m = 15.8, s2 = 64.2となり,s2 の方がだいぶん大きい。これが統計的に有意な違いであるかどうかは,X2 統計量
 
を,自由度ν= n - 1のχ2分布(カイ二乗分布)と比較することで検定できる。この式は,変動 Σ(xi - m)2,すなわち分散の n - 1 倍と,平均値 m との比である。したがって分散が平均に比して大きくなるほど,X2 の値も大きくなると考えてよい。

χ2分布の累積密度分布のうち,よく使うところだけを表にまとめておく。確率の小さいところはまず使わない。

ν
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 30 40 50
確率
0.95
3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 31.41 43.77 55.76 67.50
0.99
6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 37.57 50.89 63.69 76.15

 X2 を計算してみると,(xi - m)2 = (n - 1)・s2 なので,
X2 = 8×64.2 /15.8 = 32.5
 一方,χ2分布の表でν= (9 - 1) = 8の95%点を見ると,
χ28(0.95) = 15.51
 これの意味するところは, X2 が自由度 8 の χ2 分布に従うならば,その値が 15.51 以上になる確率は 5%以下しかない,ということである。実際に計算された X2はこれよりもはるかに大きい 32.5 なので,分散は平均に対して有意に大きいといえる。
解答:ササラダニ類は草地内で有意に集中分布をする傾向が見られた (P < 0.05)。

2.χ2 検定の数理

 第1章で行った χ2 検定の説明はあまりにも乱暴である。χ2 分布が何であるかの説明すらしていない。そこで以下,χ2 分布,およびX2 の χ2 分布への近似に間する若干の数学的説明を行う。
 標準正規分布に従う互いに独立な n 個の測定値の二乗和
 
は,自由度 n のχ2分布に従う。χ2 分布の密度関数は次の式で表される。
 
この式は覚えなくてよい。したがって解説も省略する。ただ,χ2 分布の分布型が,自由度νによって変化することを知っておけばよい。自由度ごとのχ2 分布のグラフを上に示す。
 自由度νの χ2 分布の期待値はν,分散は2νである。

 正規分布に従う n 個の標本について考えると,これを標準化した値の二乗和
 
が,自由度 n の χ2 分布に従うことになる。

 次に,ポアソン分布に従う n 個の標本について考える。ポアソン分布
 
は,λの値がある程度大きいときには正規分布に似た分布を示す。また,μ =σ2 =λ,すなわち平均と分散が等しい。したがって n 個の標本の測定値を標準化した値の変動

が,自由度 n の χ2 分布にほぼ従う*1。

*1:λの値が小さいときには,この近似は悪くなる。したがって期待値が小さい場合には,χ2 分布への近似は避けた方が良い。

 一般に母集団におけるλの値は不明なので,標本の平均 m で代用することになる。しかしその場合,変動を実際よりも過小評価することになってしまう。どの程度過小評価になるかについては,不偏分散
 
を求める際に,標本数nの代わりにn - 1で割って補正していたことを考えるとわかる。すなわち期待値は,(n - 1)/n 倍になるのである。
 自由度 n の χ2 分布の期待値は n なので,期待値がその (n - 1)/n 倍,つまり n - 1である χ2 分布を探すと,それは自由度ν= n - 1の χ2 分布である。統計量の算出のために測定値から算出された平均mを用いているので,自由度が1つ減ってν= n - 1になった,と考えてもよい。
 そんなわけで,標本の頻度分布がポアソン分布に従うかどうかを,X2  統計量を自由度ν= n - 1の χ2 分布と比較することにより検定するのである*2
*2:この近似は相当に乱暴である。実際には,平均値がもつ誤差などの影響で,分布型が χ2 分布と完全に一致するわけではないからである。ポアソン分布の正規近似も含め,χ2 検定はこうした粗い近似の上に成り立っている検定法だということを認識しておくべきである。

3.適合度の検定 -χ2 検定の応用其の壱-(教科書p.78〜80)

 理論値の分布に対して,実際の頻度分布が一致しているかどうかを検定する際に,χ2 検定を用いることができる。これを適合度の検定と呼んでいる。

例題20:Mendel (1866) は,エンドウの種子が丸く黄色い系統と,種子が緑色でしわのある系統をそれぞれ選抜して純系化した。この2系統を交配したところ,雑種第1代は全て丸く黄色い種子をつけた。そして雑種第1代の自家受粉により生じた雑種第2代では,種子の形質の割合が
丸・黄:丸・緑:しわ・黄:しわ・緑=315:108:101:32であった。
この4つの形質をもつ種子の割合は,理論比 9:3:3:1に従っていると言ってよいか。

 例によって,まずは対立仮説を立てるのだが,この場合には「理論比 9:3:3:1に従っている」がどういう意味なのかが問題になる。完全に9:3:3:1になっていないのは見ればわかることである。ここで問題にしたいのは,「理論比との違いが,偶然誤差の範囲内と言えるかどうか」である。そこで対立仮説は次のようになる。

H1:雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差の範囲を超えている(=ランダム・サンプリングが正しく行われたとすれば,理論比が正しくない)。
H0:雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差の範囲内である。

 実はもう1つ「雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差よりも小さい」という仮説も立てられるのだが,これは帰無仮説H0に含まれていると考えることができる。従って片側検定を行うことができる。

この対立仮説を検定するためには,それぞれの頻度 xi が二項分布に従うことを仮定して標準化した上で,その変動を χ2 分布と比較すればよい。すなわち統計量は,
    
(C :カテゴリ数,n :頻度の合計,xii 番目のカテゴリの頻度,pii 番目のカテゴリの理論比)
で,これを自由度lの χ2 分布と比較すべきということになる。
 ところが実際には,この統計量の分布型は自由度 C の χ2 分布とあまり一致しない。期待値 npi の算出のために頻度の合計 n を用いているため,C - 1個目までの項を計算すると最後の1項が自動的に決まってしまい(つまり自由度が C - 1),変数どうしの独立性が確保できないことが主な原因である。
そこで代わりに,
 
を,自由度ν= C - 1の χ2 分布と比較する。こうすると,自由度が C - 1になる上に,X2 の期待値も χ2 分布の期待値と同じ  C - 1になる。これは,第1章で算出した X2  統計量と同じく,
 
の形になっている。
練習16:上式で,X2 統計量の期待値が C - 1になることを計算して確かめよ。

C = 4,n = 556,(x1, x2, x3, x4) = (315, 108, 101, 32),(p1, p2, p3, p4) = (9/16, 3/16, 3/16, 1/16) なので,X2 統計量は,
 
一方,自由度ν= 4 - 1 = 3 の χ2 分布の95%点は,
χ23(0.95) = 9.35
算出された X2 統計量はこれよりも小さいので,帰無仮説 H0 は棄却されない (P > 0.05)。

解答:雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差の範囲内である。すなわち,理論値が誤っているという証拠はない。

適合度の検定がこれまでに学んで来た他の検定と異なるのは,帰無仮説 H0 の方が証明したい内容であることが多い,というところである。しかし他の検定の場合と同様,帰無仮説が棄却されなかったことは,帰無仮説が正しい,すなわち理論値が正しいことの積極的な証拠にはならない。「理論値が誤っているという証拠はない」という,消極的な支持が得られるだけである。

 余談になるが,この例題で算出された C = 0.47という値は,自由度3の χ2 分布の7.5%点に相当する。つまり,雑種第2代がもつ形質の割合の理論値からのずれは,理論値が正しかったとしても,100回中7,8回しか起こり得ないほど小さかったということである。
Mendel がエンドウの7対の対立形質それぞれについて行った交雑実験でも,雑種第2代の分離比が 3 : 1 になるという理論値からのずれを二項検定で検定すると,7対の形質全てにおいて危険率 P > 0.5(P > 0.05ではない)で帰無仮説が棄却されない。つまり,計数結果が理論値に合いすぎているのである。
 これはすなわち,Mendel が理論値とあまり合わないデータを隠したか,さもなくばデータを改ざんした可能性が高いということである。

適合度の検定の流れを整理し直してマニュアル化すると,次のようになる。

I.対立仮説を立てる。
H1:実測値の理論値からのずれは,偶然誤差の範囲を超えている(=ランダム・サンプリングが正しく行われていたとすれば,理論値が正しくない)。
H0:実測値の理論値からのずれは,偶然誤差の範囲内である。

II.

 を計算する。

III.算出されたX2 統計量を,自由度ν= C - 1*3の χ2 分布の95%点と比較する(C:カテゴリ数)。X2 統計量の方が大きければ,危険率5%で帰無仮説を棄却する。

*3:理論値が先に決定されており,標本数や平均値などが推定に用いられていない場合には,自由度ν= l の χ2 分布との比較になる。

練習17:杉山 (1999) は,純系であることが確認されている黄体色・正常翅のショウジョウバエと,突然変異型である黒体色・痕跡翅のショウジョウバエを交配し,雑種第1代どうしを交配して雑種第2代を得た。すると,雑種第2代の形質の分離比は,次のようになった。
(黄体色・正常翅,黄体色・痕跡翅,黒体色・正常翅,黒体色・痕跡翅) = (612,201,155,50)
この分離比は,理論比 9:3:3:1に従っていると言ってよいか。

本日のキーワード:偶然誤差,χ2 検定,X2 統計量,χ2 分布,変動,二乗和,理論値,適合度の検定

第13回へ→
←トップ頁へ