環境統計学  第4回

2004年5月11日  大塚泰介

1.対応がない 2 群の比較

 第 1 回で登場したスベルさん・ハカリさん夫妻は,いわゆる「蚤の夫婦」で,スベルさんの身長が 163 cm,ハカリさんは 168 cm である。2 人とも相手の身長に不満はないのであるが,やはり少し気にしているところがある。ある日,以下のような会話になった。
ハカリ「やっぱり,男の方が女より身長が高いのが普通よねぇ。」
スベル「その『普通』ってのはどういう意味だい?俺たち2人とも,そんなに極端に身長が高かったり低かったりするわけじゃないだろ。でも女のオマエのほうが大きいじゃないか。俺たち夫婦みたいに,1 対 1 で比べたら女の方が大きいことはいくらでもあるんじゃないか?」
ハカリ「そういうことを言っているんじゃないのよ。一般的に見れば,男の方が身長が高い傾向があるんじゃないか,と思っただけなのよ。」
スベル「それも一概には言えないさ。この間,小学校高学年対象の自然保護講座に手伝いに行ったんだけど,160 cm を超えるような大きな子はみんな女の子だったよ。あとこの間,女子バレーボールの試合を見に行ったんだけど,タイムアウトの時に選手と監督が集まっているところを見たら,女の選手のほとんどが男の監督より大きかったよ。ハカリの言うような安易な一般化は,性差を固定的に見る危険な考え方なんじゃないかな」
 何気なく始めた他愛のない会話だった筈なのに,ついにハカリさんは「性差を固定的に見る危険な考え方」をしていると糾弾 (?) されてしまった。そう言われてしまうとハカリさん,自分がまずいことを話題にしてしまったように何となく思ってしまい,その場ではそれ以上を語るのをやめてしまった。

 しかしハカリさん,後から思い返すとやはり納得がいかない。スベルさんの議論は,個別論を巧みに一般論へとすりかえているのではないか?なぜそれに対して有効な反論ができなかったのだろうか?そもそも,「普通」とか「一般的」という曖昧な観念を何気なく使ってしまった私の問題設定が,議論のすりかえを許してしまったのではないか?それでは,どういう問題設定をすれば「男のほうが女より身長が高い」という一見「当たり前」に思える事実を,理屈にうるさいスベルさんに納得させることができるのだろうか。

 そこでハカリさん,まず,「普通」とか「一般的」という曖昧な概念をやめて,問題にすべき母集団を明確に定義することにした。身長は年齢階層,在住地域,民族などによって多少とも傾向が違うように思える。そこでさしあたって,ハカリさんたちが属する「20 歳代・日本在住の日本人」という母集団に限定して考えることにした。
 次に,「男の方が女より身長が高い傾向がある」ということについても厳密に定義し直してみた。当然この「傾向」は,個体間ではなく母集団間での違いのことである。しかし母集団間での違いにも,平均値の違い,最頻値(モード)の違いなどいろいろ考えられる。ここではとりあえず,身長が高いほうから順位をつけた場合に,「男の方が女より上位に偏る」ことだと定義した。

 以上の定義に従って,ハカリさんは次の対立仮説を立てた。
H1 :20 歳代・日本在住の日本人では,男女の身長の分布は同じでない。
H0 :20 歳代,日本在住の日本人では,男女の身長の分布は同じである。

 帰無仮説 H0 の「男女の身長の分布は同じである」の否定になるように,H1 では「男の方が女より上位に偏る」ではなく「男女の身長の分布は同じでない」としている。帰無仮説 H0 が棄却され,かつ男の方が平均順位が上ならば,「男の方が女より上位に偏る」と言えると考えたのだ。

 
この対立仮説を検定するために最も確実な方法は,20 歳代・日本在住の日本人全員の身長を測り,全員に上から順位をつけてその平均順位を比較するというやり方である。しかしハカリさんには,そのデータを入手することができなかった。
 そこで次に考えたのが,20 歳代・日本在住の日本人の男女それぞれのサンプル標本)を母集団から何人かずつサンプリング抽出)して身長を測り,その間で比較をする方法である。しかしこの場合にはサンプリングの方法が問題である。身長の高い人や低い人を意図的に選んでくるのは論外として,「中くらいの人を選んでとる」というのも,基準が明確でないのでだめ。また,女子バレーボールの試合会場のように,母集団全体とは異なる傾向をもつ可能性が高い集団からとってくるのもだめである。
 ハカリさんは,国民全体から条件に当てはまる人を無作為(ランダム)にとってくると,統計的な扱いが容易になると考えた。これをランダム・サンプリングあるいは無作為抽出という。そこでハカリさんはランダム・サンプリングの方法を考えてみたのだが,厳密に実行しようとすればたいへん難しいことがわかった。例えば日本国民全てに番号をつけ,乱数表を用いて該当する番号の人を抽出し,その人が 20 歳代・日本在住の日本人であれば身長を測ってもらう,というような手続きが要求されるのだから。
 そこまでしなくても,ランダム・サンプリングに近い結果が得られる方法は何かないかしら,と考えたハカリさん,ふと,自分が勤める会社のことに思い当たった。ハカリさんが勤める会社は社員 50 名ほどの中堅企業で,社員は男女ほぼ半々,出身地も業務内容も人によってばらばらである。こと身長だけを問題にするのであれば,社員のうち,20 歳代・日本在住の日本人を選んで健康診断時の身長を調べれば,日本全国からランダム・サンプリングしたのと変わらない結果が得られるのではないか。

 そこでハカリさん,20 歳代・日本在住の日本人社員の今年の健康診断時の身長を調べた。該当する社員は男女 5 人ずつ,計 10 人いて,それぞれ身長が次の通りであった。
男:179.6 cm,172.3 cm,169.5 cm,168.7 cm,163.3 cm
女:167.9 cm,160.9 cm,158.4 cm,157.2 cm,149.5 cm

 20 歳代・日本在住の日本人母集団中で,もし男女の身長の分布が同じであれば,この10人の中での順位の平均あるいは合計も,男女で同じくらいになるはずである。
 しかし,順位をつけてみると,順位和はかなり違っている。
男:1 位,2 位,3 位,4 位,6 位→順位和 16
女:5 位,7 位,8 位,9 位,10 位→順位和 39
 もし,男女の身長の分布が同じだとすれば,身長の順位和が大きい方である男性の順位和が 16 以下になる可能性がどれくらいあるのだろうか?

 男性の身長の順位について考えられる全ての組み合わせは,10C5 = 252 通り。そのうち,男性の順位和が 15 になる組み合わせは 1 通り,16 になる組み合わせも 1 通り,計 2 通りしかない。しかし一方で,女性の方に同様に高い順位が偏る可能性もあり,女性の順位和が 16 以下になる 2 通りも「偏った順位になる可能性」として同様に考慮しなければならない。すなわち,男女のうち身長が高い方の順位和が 16 以下になる,という偏った組み合わせは,合計 4 通りになる。
 したがって,「H0 :20 歳代,日本在住の日本人では,男女の身長の分布は同じである」 とすると,100 回のうち 1, 2 回しか起こらないような順位の偏りが起こっているので,「H1 :20 歳代・日本在住の日本人では,男女の身長の分布は同じでない」という方がより説得力がある。そして,サンプルの平均順位は男が 3.2 位,女が 7.8 位で男の方が上位なので,身長は男の方が上位に偏っているといってもよいだろう*註

*註:実は,ここで若干の論理の飛躍がある。「男女の身長の分布が同じでない」ことの中には,どちらかが上位に偏る傾向があるという場合だけでなく,平均順位が同じで分布の形や広がりだけが違うという場合もありえるからである。しかし分布の形や広がりの違いは平均順位の違いに反映されにくいので,それが顕著であることが明らかな場合を除いて考慮する必要はない。

 しかし,この論法には若干の危険がある。なぜなら,男女の母集団における身長の分布が同じである(帰無仮説 H0)としても,このような順位の偏りを生じる可能性,すなわち危険率 P が 1.6% ほどあるからである。しかし統計学の世界では,危険率が 5% 以下であれば帰無仮説を棄却してよいことになっている。そこでハカリさんは,1.6% の危険ということを認識した上で,以下の結論を導いた。
「20 歳代,日本在住の日本人では,男の方が女よりも身長が上位に偏る傾向がある (P = 0.016)。」
さらに,上位に偏る傾向 = 高い傾向,と言ってもほぼ間違いはないので,
「20 歳代,日本在住の日本人では,男の方が女よりも身長が高い傾向がある (P = 0.016)。」
とした。

 さてハカリさん,この統計的検定の結果をスベルさんにうまく説明,説得できただろうか?しかし,説得の成否は必ずしも統計的な正しさだけには依存しないので,ここではあえて触れないことにする。

2.Wilcoxonの順位和検定

 第 1 章で用いた検定法を一般化したものが,Wilcoxon の順位和検定である。これは第 3 回で学んだ Wilcoxon の符号順位検定と同じ人が開発した方法で,ともに単に「Wilcoxon 検定」とだけ呼ばれることが多く紛らわしいが,別の方法である。2 群のデータに 1 対 1 の対応がある場合には符号順位検定を,対応がない場合には順位和検定を用いる。

 Wilcoxon の順位和検定では,以下の手続きで計算をする。
1.まず,全てのサンプルのデータを込みにして順位をつける。
2.それぞれの群について順位和を計算する。
3.計算された順位和が,両群の分布が等しいと仮定したときの順位和の 95% 範囲内にあるかどうかを検討し,その外にあれば仮説を採択する。

 Wilcoxon の順位和検定でも,同点のものがある場合には同点処理を行う。例えば 8 位タイが 2 つあるなら,8 位と 9 位の中間ということで,ともに 8.5 位として扱う。また Wilcoxon の順位和検定では,順位は大きい方からつけても,小さい方からつけてもかまわない。また統計量となる順位和についても,2 群のうち大きい方を用いても,小さい方を用いてもよい。

 ナマズ Silurus asotus は普段,河川下流域や湖沼に多く生息しているが,5 〜 6 月になると産卵のために,用水路を通って田植えの終わった水田に遡上してくることが多い。産卵時には雄が雌に「タイヤ状に」巻きつく習性があり,時には大きな雌に数匹の雄が巻きついているのが観察される。卵は水田内で孵化し,稚魚は水田の小動物を餌にして成長し,落水とともに用水路から河川,湖沼へと降っていく。
 産卵する雌と,それに巻きついている雄を比べてみると,雌の方が大きいことが多いようである。また,体長 50 cm を超えるようなナマズの「大物」は,雌のことが多いように思われる。そこで,性的に成熟した雌雄のナマズの大きさを比較するために,次のような統計的検定を試みた。

例題4-1
 前畑(未発表)は,ある地域の水田に産卵のための遡上してきたナマズをランダムに採集し,体長を測った。6 月中旬に捕獲されたナマズの体長は,雌雄それぞれ以下のとおりであった(単位 mm)。
雌:551, 540, 539, 532, 512, 509, 503, 480, 462, 460, 458, 453, 435, 414
雄:465, 420, 415, 400, 375, 357, 310, 255
 この時期にこの地域の水田に遡上したナマズの体長分布には,雌雄で違いがあったと言えるか。

 まず,対立仮説を用意する。
H1:産卵のために水田に遡上してきたナマズの体長分布は,雌雄で異なる。
H0:産卵のために水田に遡上してきたナマズの体長分布は,雌雄とも同じである。

 帰無仮説 H0 が正しいと仮定した場合,5% 以下の確率でしか起こらないような順位の偏りが起こっていることを示せれば,対立仮説である H1 の方が妥当である,という結論を導くことができる。

 そこでまず,全体の中で体長が大きいものから順に順位をつけた。

雌:1 位, 2 位, 3 位, 4 位, 5 位, 6 位, 7 位, 8 位, 10 位, 11 位, 12 位, 13 位, 14 位, 17 位 →順位和 113
雄:9 位, 15 位, 16 位, 18 位, 19 位, 20 位, 21 位, 22 位 →順位和 140

 なお,表計算ソフトなどで順位を算出する場合,同点のものを補正するのを忘れがちである。その結果,検定の結果に狂いが生じることがある。そこで,全順位の合計が

(ただし N1 , N2 は2つの群それぞれの標本数,N1N2 )
になっていることを確認することを勧める。
今回の場合N1 = 8,N2 = 14 なので
(8 + 14)(8 + 14 + 1)/2 = 253
140 + 113 = 253
と一致しており,順位の合計に誤りがなかったことがわかる。

 もし,雌雄の体長分布に差がなければ,1 位から 22 位までの順位がついているので,雌雄それぞれの平均順位の期待値はともに (1 + 22) / 2 = 11.5 位である。これに対して雌雄の実際の平均順位は,それぞれ 113/14 = 8.1 位,140/8 = 17.5 位であり,雌の方が上位に偏っている。この偏りが統計的に有意であるか,すなわち,体長分布が雌雄で等しい場合には 5% 以下の確率でしか起こりえないようなものであるかどうかを検討すればよい。
 しかし,標本数が少ない方の雄について見たとしても,順位和が 140 よりも大きくなる組合せがどれだけあるか,という計算はかなり面倒で,はっきり言ってやっていられない。暇な人はやってみるのも一興だが。そこで今回もまた,先人が残した計算結果,数表を利用する。この数表には,2群間で分布に差がないとすれば,標本数が少ない方の順位和がその範囲に収まる確率が95%以上になる,逆に言えばそれ以上または以下になる確率が 5% 未満になるという,順位和の範囲が示されている。したがって,順位和がその範囲の外側にあれば,2つのグループ間に危険率 5% 未満 (P < 0.05) で有意差があるということができる。

Wilcoxon の順位和検定の数表(N1< N2P < 0.05,両側検定)


N1


3 4 5 6 7 8 9
N2
3 -





4 - 10/26




5 6/21 11/29 17/38



6 7/23 12/32 18/42 26/52


7 7/26 13/35 20/45 27/57 36/69

8 8/28 14/38 21/49 29/61 38/74 49/87
9 8/31 14/42 22/53 31/65 40/79 51/93 62/109
10 9/33 15/45 23/57 32/70 42/84 53/99 65/115
11 9/36 16/48 24/61 34/74 44/89 55/105 68/121
12 10/38 17/51 26/64 35/79 46/94 58/110 71/127
13 10/41 18/54 27/68 37/83 48/99 60/116 73/134
14 11/43 19/57 28/72 38/88 50/104 62/122 76/140
15 11/46 20/60 29/76 40/92 52/109 65/127 79/146
16 12/48 21/63 30/80 42/96 54/114 67/133 82/152
17 12/51 21/67 32/83 43/101 56/119 70/138 84/159

 雄が 8 個体,雌が 14 個体,なので,N1 = 14,N2 = 8 のところを見る。すると,雌雄で分布に差がないとした場合,数が少ない方である雄の順位和は,95% 以上の確率 (= 5% 以下の危険率)で,62 から 122 までの範囲の内側に収まるということが読み取れる。
 実際の雄の順位和は 140 で,範囲の上限の 122 よりもずっと大きい。これは,雌雄の体長分布に差がないとすれば,これほどの順位の偏りが生じる可能性は 5% 未満(この場合にはもっと可能性が低い)であるということである。したがって,帰無仮説は P < 0.05 で棄却される。
 雄の平均順位は,雌雄で分布に差がないとした場合の期待値よりもずっと低かったので,雄の方が小さい方,雌の方が大きい方にそれぞれ偏る傾向がある,と結論してよい。よって,
「産卵のために水田に遡上してきたナマズの体長は,雌の方が雄よりも大きい有意な傾向が見られた (P < 0.05)。」

問題 4-1
 上記のナマズ個体群について,産卵期初期の 4 月下旬に捕獲された雌と,産卵期後期の 6 月中旬に捕獲された雌の体長を測定したところ,それぞれ以下のとおりであった (単位 mm)。
4月下旬:457, 480, 483, 499, 519, 525
6月中旬:414, 435, 453, 458, 460, 462, 480, 503, 509, 512, 532, 539, 540, 551
 この地域の水田に 4 月下旬に遡上したナマズの雌と,6 月中旬に遡上したナマズの雌には,体長分布に違いがあったとしてよいか。

今日のキーワード:母集団サンプル = 標本サンプリング = 抽出ランダム・サンプリング = 無作為抽出Wilcoxon の順位和検定期待値