環境統計学  第3回

2004年4月27日  大塚泰介

1.Wilcoxonの符号順位検定

 前回扱った符号検定では、対応する二群のデータの大小関係のみを符号化して用いた。同様のデータに対して、順位の情報を加味して検定するのが Wilcoxon の符号順位検定である。

例題3-1
 BW 湖は広大な湖で、大小 100 以上もの流入河川をもつ。その中から 7 つをランダムに選び、ある晴れた日に河口域で pH を同時測定したところ、9 時と 15 時の測定値は次のとおりであった。

河川 A B C D E F G
9時のpH 7.2 6.9 7.1 7.2 7.5 6.8 7.1
15時のpH 7.9 6.8 7.2 7.5 8.3 7.0 7.2

この結果から、BW 湖流入河川ではこの日、9時よりも15時に pH が高い傾向があったと言えるか。

 まず、対立仮説を設定する。
H1:この日の BW 湖流入河川では、9 時よりも 15 時に pH が高い、あるいは低い傾向があった。
H0:この日の BW 湖流入河川では、9 時から 15 時までの pH の変化に傾向がなかった。

 帰無仮説 H0 で pH の変化に「傾向がなかった」としているので,検証すべき仮説はその否定である「(高いまたは低い)傾向があった」になる。高い傾向があるかどうかは,帰無仮説 H0 が棄却されてから,データに照らしてより蓋然性が高い方を選べばよい。

 この問題を,符号検定によって検定することができる。その場合の手続きは以下の通りである。なお,「対になった値の差」とはこの場合,9 時と 15 時の pH の差,すなわち (15 時の pH) - (9 時の pH) である。

1.まず,対になった値の差を求める。差がなかったものは計算から除外する。
2.値の差の符号を求める。
3.符号が + のものと - のものそれぞれを計数する。
4.実測された + と - の数が,1/2 ずつから有意に偏っているかどうかを検討し,偏っていれば仮説を採択する。

 実際に符号検定を行ってみる。- の数が 1 つ,+ の数が 6 つなので,- の数がこれ以下になる方法は 1 + 7 = 8 通り。反対に + の数が 1 つ以下になる方法も 8 通り。組み合わせの総数は 27 = 128 通りである。全てについて + になる確率と - になる確率が等しいとすれば,全ての組み合わせが等しい確率で起こるので,実測値よりも偏った結果になる確率は (8 + 8) / 128 = 0.125。よって帰無仮説は棄却されず,9 時よりも 15 時に pH が高い有意な傾向はみられなかった (P = 0.125)。

 これに対して Wilcoxon の符号順位検定では,絶対値の順位という情報を同時に用いて,以下の手続きで計算をする。
1.まず,対になった値の差を求める。差がなかったものは計算から除外する。
2.値の差を符号と絶対値に分けて記す。
3.絶対値の小さい方から順位をつける。
4.符号が + のものと - のものそれぞれについて順位の合計(順位和)を計算し,小さい方を統計量 T とする。
5.統計量 T N(N+1)/4 (N は対の数)に比べて有意に小さいかどうかを検討し,小さければ仮説を採択する。

 上記の符号検定の場合に比べて,順位の情報が加味されているのがわかるだろう。なお,+,−両方の絶対値順位の総和は N(N+1)/2 なので,もし順位和が+,−双方で等しいとすれば,その値は N(N+1)/4 となる。
 しかしこの計算をしてみると,困ったことに,9 時と 15 時の pH 差の絶対値が 0.1 という河川が 3 つもある。この 3 つは,小さい方から数えると全て 1 位である。こういう場合は全部を同点 1 位として扱ってよいのであろうか。実はそうはいかない。順位和,つまり順位の合計が同点がない場合と違ってきてしまうため,後の検定手続きに支障を来たすのである。そこで同点がある場合には,その平均順位を与える。この場合には同点 1 位の 3 河川は,同時に 2 位でもあり, 3 位でもあると考えられる。そこでそれぞれに対して
(1 + 2 + 3)/3 = 2(位)
を順位として与えておく。このような処理を同点処理と呼んでいる。

 上記の3.までの計算結果をまとめると下表のようになる。

河川 A B C D E F G
9 時のpH 7.2 6.9 7.1 7.2 7.5 6.8 7.1
15 時のpH 7.9 6.8 7.2 7.5 8.3 7.0 7.2
pH の差 0.7 -0.1 0.1 0.3 0.8 0.2 0.1
符号 + - + + + + +
絶対値 0.7 0.1 0.1 0.3 0.8 0.2 0.1
絶対値の順位 6 2 2 5 7 4 2

 続いて,絶対値の順位の偏りについて検討する。もし、pH が 9 時より 15 時に上がる傾向も下がる傾向もないとすれば、符号が + の側も - の側も絶対値の順位和が同じくらいになることが期待される。その場合、順位和の期待値は + 側、- 側ともに (1 + 7)×7 / 4 = 14 位になる。そこで、符号が + のもの、- のものそれぞれについて順位和を計算して、両者が同程度になっているかどうかを調べてみる。
+:6 + 2 + 5 + 7 + 4 + 2 = 26
-:2
すると、順位和は + の方がずっと大きい。すなわち、pH は 15 時のほうが高い傾向がありそうである。この傾向が統計的に有意であることを言うためには、これほどの順位和の違いは「9 時から 15 時までの pH の変化に傾向性がなかった」とすれば稀に(確率 5% 以下で)しか起こらないことを示せばよい。

 さて、もし変化に傾向性がなければ、絶対値順位が1位の河川の符号が + になるか - になるかは、確率的に 1/2 ずつである。2 位、3 位、4 位、5 位、6 位、7 位についても、それぞれ同様である。つまり、それぞれの順位を + と - に振り分ける方法は、全部で 27 = 128 通りあって、それぞれが等しい確率で起こるはずである。
 ここで、小さい方の順位和である - 側の 2 を、検定に用いる統計量 T とする。すると順位和 T が 2 以下になる方法は、- のものが一つもない場合(T = 0)、1 位だけが - の場合(T = 1)、および 2 位だけが−の場合(T = 2)の計 3 通りしかない。同様に、15 時の pH の方が低い方へ偏った場合について考えると,+ 側の順位和 T が 2 以下になる方法もやはり 3 通りである。
 結局,どちらか小さい側の順位和 T が 2 以下になる確率は、(3 + 3) / 128 = 0.047。したがって危険率 P = 0.047で帰無仮説は棄却される。9 時よりも 15 時に pH が高い河川の方が多かったので、9 時よりも 15 時に pH が高い有意な傾向があったと言える (P = 0.047)。

 符号検定ではやや危険率が高く,有意な傾向は認められなかったが,Wilcoxon の符号順位検定では辛うじて有意な傾向が認められた。この理由については後に考察する。

例題 3-2
 前回の例題 2-2 で扱ったのと同じデータである。西田・大西 (2001) は,被験者 26 人に落語を聞かせ,その直前 30 分以内と直後 30 分以内に NK 細胞活性(相対値%)を測定した。以下はその結果である。
71 70 68 67 66 66 65 61 60 60 59 59 58 58 57 50 50 50 49 47 42 42 40 38 31 29
69 69 71 63 71 69 70 58 65 56 64 55 70 69 56 67 57 49 46 51 52 46 46 46 36 32

この結果から、落語を聞いた後に NK 細胞の活性が上昇する傾向があったと言えるかどうかを、Wilcoxon の符号順位検定によって検定せよ。

対立仮説は前回と同じである。
H1 :落語を聞いた後に NK 細胞の活性が上昇または下降する傾向がある
H0 :落語を聞いた後に生じる NK 細胞の活性変化に傾向はない

そして、結果を符号と絶対値に分けて記し、絶対値の小さい方から順位をつける。
71 70 68 67 66 66 65 61 60 60 59 59 58 58 57 50 50 50 49 47 42 42 40 38 31 29
69 69 71 63 71 69 70 58 65 56 64 55 70 69 56 67 57 49 46 51 52 46 46 46 36 32
-2 -1 3 -4 5 3 5 -3 5 -4 5 -4 12 11 -1 17 7 -1 3 4 10 4 6 8 5 3
符号 - - + - + + + - + - + - + + - + + - - + + + + + + +
絶対値 2 1 3 4 5 3 5 3 5 4 5 4 12 11 1 17 7 1 3 4 10 4 6 8 5 3
絶対値順位 4 2 7 12 17 7 17 7 17 12 17 12 25 24 2 26 21 2 7 12 23 12 20 22 17 7

符号が+のもの、−のものそれぞれについて順位和を計算する。
+:7 + 17 + 7 + 17 + 17 + 17 + 25 + 24 + 26 + 21 + 12 + 23 + 12 + 20 + 22 + 17 + 7 = 291
−:4 + 2 + 12 + 7 + 12 + 12 + 2 +2 + 7 = 60
このうち小さい方の 60 を、検定に用いる統計量Tとする。

 それでは,統計量Tが60より小さくなる確率はどれだけだろうか?ここで直接計算をすることはあまりお勧めしない。こういう場合には,先人の計算結果,数表を用いる。

Wilcoxon の符号順位検定の数表(P = 0.05,両側検定)
N 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
T 0 2 4 6 8 11 14 17 21 25 30 35 40 46 52 59 66 73 81 89 98 107 116 126 137

ただし,N は同点のものを除いた標本の対の数である。
 この数表には,対になる標本の大小関係に傾向性がなければ,統計量 T がそれ以下になる確率が 5% 未満になる最大の T の値が示されている。すなわち,T が数表の値以下であれば,2つのグループ間に P < 0.05 で有意差があるということができる。

 N = 26のところを見ると,T = 98。計算された T はこれより小さい 60 なので,落語を聞いた直後には,落語を聞く直前よりも NK 細胞活性が高くなる有意な傾向があったと言える (P < 0.05)。

 おや?何か変だぞ。第 2 回の例題 2-2 で,同じデータを符号検定で検定したときには,かなり余裕をもって「有意差なし」と判定されたのではなかったか?そう言えば例題 3-1 でも,危険率は僅差とはいえ,符号検定で有意差なしと判定されたものが Wilcoxon の符号順位検定で有意差ありと判定されていた。これはどういうことだろうか?
 実は,Wilcoxon の符号順位検定では,順位を加味している分,符号検定よりも有意差を検出しやすい傾向があるのである。これを検出力が高いという。したがって対応する二群の大小関係に傾向があることを論証したい場合,差の大きさに順位がつけられるのであれば,Wilcoxon の符号順位検定を用いた方が良いことになる。
 もう1つ注意してほしいのは,「有意差がない」ことは「差がない」ことを必ずしも意味しない,ということである。帰無仮説が棄却されないことは,差がないことの積極的な証拠にはならない。上記の例で,落語を聞く前後で NK 細胞の活性に有意差がなかったとしたら,「データが不足しているようなので差について論じるのをやめておこう」「被験者を増やして再実験をしよう」(判定の保留),さもなくば「差があるとしても,これだけの標本数で有意差にならないのだから大した差ではないのだな」(帰無仮説の消極的な採択)などと考えるべきなのである。

問題 3-1
 日本河川協会 (1998, 2001) は,全国の一級河川に設けられた定点で毎月測定された BOD 値をまとめている。その中から任意に選んだ 12 定点では,1996 年と 1998 年に測定された BOD の 75% 点(測定値を小さい方から順に並べたとき,上位から 75% にあたる値)が下表の通りであった。
河川 美幌川 北上川 隅田川 阿賀野川 天竜川 東高瀬川 由良川 旭川 古川 小瀬川 仁淀川 川内川
地点 美幌橋 船田橋 岩淵水門 松浜橋 中央橋 三須橋 以久田橋 合同堰 大下 大和橋 八田堰 栗野
1996年 1.3 0.9 6.2 0.7 3.2 2.1 0.8 0.8 2.5 3.2 0.9 0.8
1998年 2.0 0.9 5.4 0.8 2.4 1.8 0.7 0.8 2.0 2.8 0.7 0.5

以上の結果から,日本の一級河川では,1996 年より 1998 年に BOD値 (75% 点) が低い傾向があったと言ってよいか。

問題 3-2
 「右利きのひとは右手を多く使うので,左手に比べて右手が大きくなる」という説がある。この説の真偽を確かめるため,琵琶湖博物館で働く 16 人に,右手と左手の掌の長さ(手根骨の基部から中指の先端まで)を測定してもらった。その結果をまとめたのが下表である。

利き手
















右手の長さ (mm)
173
175
165
188
175
183
173
171
198
194
189
189
181
178
167
178
左手の長さ (mm)
169
175
165
189
180
189
168
171
200
191
183
191
182
183
167
176

 以上のデータが日本人の傾向を代表していると仮定した上で,「右利きの人は右手の方が大きい」かどうかを Wilcoxon の符号順位検定を用いて検討せよ。また,「利き手の方が大きい」かどうかについても同様に検討せよ。

 なお,標本の対の数 N が十分に大きい(概ねN > 25)ときには,次の判別規準に従う場合に帰無仮説を棄却することができる。

問題 3-3
 例題 3-2 を上記の判別規準に従って検定し,結果を確かめよ。

本日のキーワード:Wilcoxon の符号順位検定順位順位和同点処理数表検出力