環境統計学 第3回

2003年5月1日   大塚泰介

1.Mann-WhitneyのU検定が使える場面

A. データが連続変数の場合
 自然科学の世界では、得られる測定値が連続変数であることが多い。連続変数には原点が意味をもつ比率と、原点が便宜的に決められている間隔がある。たとえば同じ温度でも、摂氏の温度は間隔、絶対温度は比率になる。
連続変数データには同点なしで順位をつけることができる。同点が生じるのは、値の差が測定精度以下になった場合だけである。従ってMann-WhitneyのU検定など、順位を用いた検定を適用することに何の問題もない。
第2回で扱ったナマズの体長データは、連続変数のうち比率にあたる。間隔の場合でも、検定の方法は同様である。

B. データが離散変数の場合
 計数によって得られたデータは、必ず0または自然数の値をとり、それ以外の値をとらない。このように飛び飛びの値をとる変数を離散変数(または不連続変数)という。
離散変数にも順位をつけることができるが、同点が生じる可能性が大きくなるため、順位和検定の適用時には同点処理を正しく行うことが重要になる。

例題3:かつてカワムツという種にまとめられていた魚には、実は2種が含まれていたことが明らかになり、河川上中流域に多い本来のカワムツと、河川下流域や沼沢に多いヌマムツの2種に分けられることになった(Hosoya et al. 2003)。以下はその2種について、側線鱗数を計数した結果である。
カワムツ:47, 47, 48, 50, 50, 50, 50, 51, 51, 52, 52, 52
ヌマムツ:54, 57, 58, 58, 60, 61, 61, 61, 65
ヌマムツの側線鱗数は、カワムツより多い傾向があるといってよいか。

まず、対立仮説を用意する。
H1:カワムツとヌマムツの側線鱗数には、どちらかが多い傾向がある
H0:カワムツとヌマムツの側線鱗数には、どちらが多い傾向もない(帰無仮説)

一見してカワムツの側線鱗数の方が少なそうである。そこで、側線鱗数が少ない方から順位をつける。もし、カワムツの順位が「母集団における分布が等しい場合にはめったに起こらないほど」小さい方に偏っていれば、側線鱗数はカワムツの方が少ない傾向があると言って良いことになる。
同点の補正に注意しながら順位を与えると、
カワムツ順位:1.5, 1.5, 3, 5.5, 5.5, 5.5, 5.5, 8.5, 8.5, 11, 11, 11
ヌマムツ順位:13, 14, 15.5, 15.5, 17, 19, 19, 19, 21
カワムツ、ヌマムツの標本数はそれぞれN1 =12、N2 =9なので、順位和および平均順位は以下の通りとなる。
カワムツ:順位和 R1 =78、平均順位6.5位
ヌマムツ:順位和 R2 =153、平均順位17位

平均順位が小さい方のカワムツについてU統計量を計算すると、
U1 = R1 - N1 (N1+1)/2 = 78 - 12・13/2 = 0
N1 =12、N2 =9におけるU統計量の5%点を数表から読み取ると、U = 26。計算されたU1 はこれよりずっと小さいので、両者の側線鱗数には有意差があるといえる (P<0.05)。

注意:側線鱗数の分布に違いがあるからと言って、それが分類の決定的な基準になると即断してはならない。ヌマムツ、カワムツともに側線鱗数にはかなりのばらつきがあるので、例えば側線鱗数が52の個体がカワムツであるか、ヌマムツの特に側線鱗数が多い個体であるかについては、このデータだけからは判断できないのである。側線鱗数を分類の決定的な基準とするためには、もっとたくさんの(反論を実質的に封じ込められるだけの)標本をいろいろな地域から集めて、ヌマムツとカワムツの側線鱗数に重なりがないことを示す必要がある。

練習4:これまでカワムツとオイカワの間には側線鱗数に大きな違いがあるとされてきた。しかし、側線鱗数が多い個体群が別種とされたため、カワムツとオイカワの側線鱗数の違いは従来考えられていたほどではなかったことになる。
 そこで、琵琶湖博物館にある滋賀県産オイカワの標本6個体について側線鱗数を計数したところ、以下の通りであった。
オイカワ:43, 43, 43, 43, 44, 45
このデータと先述のカワムツの側線鱗数との比較から、オイカワの側線鱗数がカワムツよりも少ない傾向があると言ってよいか。

C. データが順位の場合
 稀に、データが最初から順位の形で得られることがある。それよりもよくあるのは、データが何段階かの階級として得られることで、特に社会統計のデータでは非常に多い。こうした場合にも、Mann-WhitneyのU検定を用いることができる。

例題4:島根県益田市が1996年に20歳以上の市民を対象に行ったアンケートで、「男は仕事、女は家庭」という考え方に対する賛否を聞いたところ、男女でそれぞれ以下の結果となった。ただし「わからない」と解答したものおよび無解答は除いてある。


賛成 どちらかといえば賛成 どちらかといえば反対 反対
24 83 31 17
26 104 83 25

この結果から「男は仕事、女は家庭」という考え方に対する賛否の傾向が、男女で異なると言ってよいか。

 まず、対立仮説を用意する。
H1:「男は仕事、女は家庭」に対する賛否の傾向は男女で異なる
H0:「男は仕事、女は家庭」に対する賛否の傾向は男女で異ならない(帰無仮説)

次に順位をつけるのだが、この場合には多くの標本が4つの階級に分けられているため、同点がたいへんに多い。賛成、どちらかといえば賛成、どちらかといえば反対、反対 の総数はそれぞれ50、187、114、42なので、この順に順位をつけるなら、それぞれ1〜50位、51〜237位、238〜351位、352〜394位になる。そこで、賛成、どちらかといえば賛成、どちらかといえば反対、反対 のそれぞれに属する標本に対して、階級内での平均順位である25.5位、144位、294.5位、373位を与える。

男女の標本数はそれぞれN1 =155、N2 =238なので、順位和および平均順位は以下の通りとなる。
男:順位和 R1 = 25.5・24 + 144・83 + 294.5・31 + 373・17 = 28034.5、平均順位 約181位
女:順位和 R2 =25.5・26 + 144・104 + 294.5・83 + 373・25 = 49407.5、平均順位 約208位

平均順位が小さい方の男についてU統計量を計算すると、
U1 = R1 - N1 (N1+1)/2 = 28034.5 - 155・156/2 = 15944.5
N1 =155、N2 =238におけるU統計量の5%点を数表から読み取ると、…そんなものは記されていない。このように標本数が大きいときには、以下の値を計算する。
 
この値が-1.96よりも小さくなれば、危険率5%以下で両者の分布に有意差があるといってよい*1。ここでは、
z1 = (15944.5 - 155・238/2)/{155・238・(155 + 238 + 1)/12}1/2≒-2.27
この値は-1.96よりも小さいので、「男は仕事、女は家庭」に対する賛否の傾向には男女間で有意差があり、男性の方が賛成する傾向がやや強かったといえる(P<0.05)。

*1:標本数が十分に大きいとき、U統計量がほぼ正規分布に従うことを利用している。正規分布については後に扱う。

2.Mann-WhitneyのU検定が使えない場面

A. データが類別の場合
 データがいくつかのグループに分けられていて、グループ間に順位がつけられないような場合、これを類別データという。類別データにはもはや順位をつけることができないため、U検定などの順位和検定を適用することができない。

B. ランダム・サンプリングができていない場合
 Mann-WhitneyのU検定に限らず、多くの統計検定はランダム・サンプリングを前提にしている。したがってランダム・サンプリングができなかった場合には、一般的に解析結果の信頼性が下がる。
例えば1章のCで扱ったようなアンケート調査では、二段階無作為抽出法などの方法で、アンケートの対象者をランダムに選ぶようにしている。しかし、例え対象者をランダムに選んだとしても、解答した人と解答しなかった人の間に何らかの傾向の違いがある場合が少なくないため、特に解答率が低い場合には結果の解釈に慎重でなければならない。
1章のCの例でも、「男は仕事、女は家庭」に対する賛否の傾向は、アンケートに解答した人と解答しなかった人の間で差があるかもしれない。しかし解答した人がもつ賛否の傾向が、男女で反対の方向に偏ることは考えにくいので、益田市民全体に男女の傾向の違いが見られると推定することに大きな問題はない。

C. 母集団があまりにも小さい場合
 Mann-WhitneyのU検定に限らず、多くの統計検定は無限母集団、つまり母集団が無限に大きいことを前提にしている。ただし、実際には有限母集団であっても、規模が十分に(主観的な表現ではあるが)大きければ、検定結果に狂いが生じることは少ない。
 しかし、以下の場合はどうであろうか。

例題5:織田家と豊臣家にはそれぞれ5人の兄弟がいる。それぞれから任意の4人を選び、体重(kg)を測定したところ、以下のとおりであった。
織田:52, 56, 57, 59  豊臣:58, 62, 66, 75
織田家の兄弟は豊臣家の兄弟より体重が軽い傾向があるといって良いか。

体重の軽い方から順位をつけると、次のようになる
織田:1, 2, 3, 5→平均2.75位  豊臣:4, 6, 7, 8→平均6.25位
Mann-WhitneyのU検定を適用すると、この2つの兄弟の間に有意差は検出されない(各自試みよ:P < 0.05)。しかし、例え測定されていない残り1人ずつの体重がどうであれ、織田と豊臣の体重の平均順位が逆転することはないのである。
織田家の残り1人が全体で最も体重が重く、豊臣家の残り1人が全体で最も体重が軽い場合、両家の体重の順位はそれぞれ、
織田:2, 3, 4, 6, 10→平均5位  豊臣:1, 5, 7, 8, 9→平均6位

 すなわち、母集団があまりにも小さいと、実際には差があることが確定しているのに有意差がないと判定してしまう可能性が生じてくるのである。

D. 比較する2群のデータに対応がある場合
 これは例えば、同一個体を用いて処理前と処理後のデータを比べたり、いくつかの測定定点である時期と別の時期のデータを比べたりする場合である。この場合には、第5回で扱うWilcoxonの符号順位検定などを使うべきである。

本日のキーワード:連続変数、比率、間隔、離散変数、順位、階級、類別、無限母集団、有限母集団
第4回へ→


←トップ頁へ