環境統計学 第2回

2003年4月24日  大塚泰介

1.Wilcoxonの順位和検定

 第1回の講義で解説した検定法を一般化したものが、Wilcoxonの順位和検定である。

例題2:前畑(未発表)は、ある地域の水田に産卵のための遡上してきたナマズをランダムに採集し、体長を測った。雌の体長は、産卵期初期の4月下旬に捕獲されたものと産卵期後期の6月中旬に捕獲されたもので、それぞれ以下のとおりであった(単位mm)。
4月下旬:457, 480, 483, 499, 519, 525
6月中旬:414, 435, 453, 458, 460, 462, 480, 503, 509, 512, 532, 539, 540, 551
 この地域の水田に遡上した雌ナマズの体長分布が、4月下旬と6月中旬で違いがあったかどうかを統計的に検定せよ。

 まず、対立仮説を用意する。
H1:遡上してくる雌ナマズの体長分布は、4月下旬と6月中旬で異なる
H0:遡上してくる雌ナマズの体長分布は、4月下旬と6月中旬で等しい(帰無仮説)

 帰無仮説H0 が正しいと仮定した場合、めったに起こらない(5%以下の確率でしか起こらない)ような順位の偏りが起こってしまうことを示せれば、対立仮説であるH1 の方が妥当である、という結論を導くことができる。

 そこでまず、全体の中で体長が小さいものから順*1に順位をつけて,それぞれ合計する(これを順位和という)。同点の場合、例えば8位タイが2つあるなら、8位と9位の中間ということで、ともに8.5位として扱う。
*1:大きなものから順、でもかまわない。

4月下旬:4位, 8.5位, 10位, 11位, 15位, 16位 →合計64.5位
6月中旬:1位, 2位, 3位, 5位, 6位, 7位, 8.5位, 12位, 13位, 14位, 17位, 18位, 19位, 20位 →合計145.5位

 なお,表計算ソフトなどで順位を算出する場合、同点のものを補正するのを忘れがちである。その結果、検定の結果に狂いが生じることがある。そこで、全順位の合計が
 
(ただしN1 , N2 は2つの群それぞれの標本数)
になっていることを確認することを勧める。
今回の場合N1 =6、N2 =14なので
(6+14)(6+14+1)/2 = 210
64.5+145.5 = 210
と一致しており、順位の合計に誤りがなかったことがわかる。

 もし、4月下旬と6月中旬の体長分布に差がなければ、それぞれの平均順位はともに (1+20)/2=10.5位程度になるはずである。その場合の4月下旬と6月中旬の順位和の期待値は、それぞれ10.5×6=63位、10.5×14=147位となる。4月下旬の順位和は期待値よりも僅かに大きい64.5位なので、体長が大きい方に偏っている可能性がある、といえる。

 しかし、標本数が少ない方の4月下旬について見たとしても、合計順位が64.5位よりも大きくなる組合せがどれだけあるか、などという計算は、はっきり言って面倒で、やっていられない。暇な人はやってみるのも一興だが。
   そこで、先人が残した数表を利用する。この数表には、2群間で分布に差がないとすれば、合計順位がその範囲に収まる確率が95%以上になる、逆に言えばそれ以上または以下になる確率が5%以下になるという、順位和の範囲が示されている。したがって、順位和がそれ以上または以下であれば、2つのグループ間に危険率5%以下で有意差があるということができる。

Wilcoxonの順位和検定の数表(P<0.05、両側検定)


N1


3 4 5 6 7 8 9
N2
3 -





4 - 10/26




5 6/21 11/29 17/38



6 7/23 12/32 18/42 26/52


7 7/26 13/35 20/45 27/57 36/69

8 8/28 14/38 21/49 29/61 38/74 49/87
9 8/31 14/42 22/53 31/65 40/79 51/93 62/109
10 9/33 15/45 23/57 32/70 42/84 53/99 65/115
11 9/36 16/48 24/61 34/74 44/89 55/105 68/121
12 10/38 17/51 26/64 35/79 46/94 58/110 71/127
13 10/41 18/54 27/68 37/83 48/99 60/116 73/134
14 11/43 19/57 28/72 38/88 50/104 62/122 76/140
15 11/46 20/60 29/76 40/92 52/109 65/127 79/146
16 12/48 21/63 30/80 42/96 54/114 67/133 82/152
17 12/51 21/67 32/83 43/101 56/119 70/138 84/159

 今回は、4月上旬に遡上したナマズが6個体、6月中旬に遡上したナマズが14個体なので、N1 =6、N2 =14のところを見る。すると、2つのグループで分布に差がないとした場合、数が少ない方である4月中旬のナマズの合計順位は、95%以上の確率(=5%以下の危険率)で、38位から88位の範囲の内側に収まるということが読み取れる。
 実際の順位は64.5位で、38位から88位までの範囲に完全に収まっている。これは、4月下旬と6月中旬のナマズの体長分布に差がないとしても、このくらいの順位の偏りが生じる可能性は5%以上(この場合にはもっと)あるということである。すなわち、両者の体長の違いは危険率5%を見こんでも有意ではない。これを「P > 0.05」と表記する。
 したがって、帰無仮説は棄却されず、4月下旬に遡上した雌ナマズと6月中旬に遡上した雌ナマズの体長に差があるとは言えない。

 注意:帰無仮説が棄却されず、「有意差」がないと結論された場合でも、両者の母集団の分布に「差」がないと言いきることはできない。標本数がより多くなれば、有意差が検出できるようになる可能性があるからである。ただし上の例では、標本が多い割に順位の偏りが小さいので、両者の差は「あってもとるに足らない」と結論してもよいだろう。

練習2:上記のナマズ個体群について、6月中旬に捕獲された雌雄の体長を測定したところ、それぞれ以下のとおりであった(単位mm)。
雄:255, 310, 357, 375, 400, 415, 420, 465
雌(既出):414, 435, 453, 458, 460, 462, 480, 503, 509, 512, 532, 539, 540, 551
 この地域の水田に6月中旬に遡上したナマズの体長分布に、雌雄で違いがあったかどうかを検定せよ。

2.Mann-WhitneyのU検定 (教科書p109〜p116)

   Mann-WhitneyのU検定は、Wilcoxonの順位和検定と同じく順位和に基づいた検定で、適用できるデータも、検定の結果も、Wilcoxonの順位和検定と全く同じである。
違うのは用いる統計量だけである。すなわち、Wilcoxonの順位和検定では、標本数が少ない方の順位和を直接用いたのに対して、U検定では順位和から順位和の最小値を引いた値
 
Ui:U統計量,Ri:平均順位が小さい方の群の順位和,Ni:平均順位が小さい方の群の標本数)
を算出して,数表と比較する。U1が対応する数表の値より小さければ,2群の値の分布に違いがある,と判定する。

Mann-Whitney検定表(P < 0.05、両側検定)


N1


3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N2 3
- - 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8
4
- 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 13
5
0 1 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20
6
1 2 3 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27
7
1 3 5 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
8
2 4 6 8 10 13 15 17 19 22 24 26 29 31 34 36 38 41
9
2 4 7 10 12 15 17 20 23 26 28 31 34 37 39 42 45 48
10
3 5 8 11 14 17 20 23 26 29 33 36 39 42 45 48 52 55
11
3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58 62
12
4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65 69
13
4 8 12 16 20 24 28 33 37 41 45 50 54 59 63 67 72 76
14
5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 48 83
15
5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85 90
16
6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92 98
17
6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99 105
18
7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106 112
19
7 13 19 25 32 38 45 52 58 65 72 48 85 92 99 106 113 119
20
8 13 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 127

 例題2で取り上げた雌ナマズの体長の4月下旬と6月中旬の比較について,U検定を試みる。平均順位は4月下旬の方が64.5/6 = 10.75,6月中旬の方が 145.5/14≒10.39なので,平均順位が小さい6月中旬の方についてU統計量を算出すると,
U2 = R2 - N2 (N2+1)/2 = 145.5 - 14・15/2 = 40.5
数表の対応する場所(N1 =6, N2 =14)を見ると,値は17。計算された値はこれよりも大きい40.5なので,ナマズの体長分布の違いは有意でない(P > 0.05)。

練習3:練習2の問題をMann-WhitneyのU検定によって検定し,Wilcoxonの順位和検定と同じ結果になることを確認せよ。

今日のキーワード:Wilcoxonの順位和検定,順位和,期待値,有意差,数表,Mann-WhitneyのU検定
第3回へ→

←トップ頁へ