環境統計学  第2回

2004年4月20日 大塚泰介

1.検定手続の定式化

 前回の講義を聴いて、違和感を感じた人も少なくないと思う。統計的検定を行うためには、いつもこんなに隅々まで理詰めで考え、それを説明しきらなければいけないのだろうか、と。もし日常的にあのような考え方をし、それを他人に説明しなければ気が済まない人がいるとすれば、きっと強迫神経症を疑われることだろう。
 私に強迫神経症的な要素があることは否めないが、それでも常にああいった考え方、説明のしかたをしているわけではない。もっと気軽に統計的な思考をし、統計的検定を行っている。その気軽さを保障しているのは、「暗黙の了解」と「定式化された手続き」である。

 前回の講義で扱った「ジャンケンが強いハカリさん」に関する検定の記述は、以下のように定式化される。なお H1 は検証すべき仮説,H0 はこれと対立する帰無仮説である。この両者は互いに矛盾しているので,合わせて対立仮説と呼ばれている。P > 0.05 とは,危険率 P が 0.05 = 5% より大きいことを意味している。

H1:ハカリさんがスベルさんに対してジャンケンで勝つ確率は,1/2 でない。
H0:ハカリさんがスベルさんに対してジャンケンで勝つ確率は,1/2 である。

 ハカリさんはスベルさんとジャンケンして 8 勝 2 敗だった。H0 が正しいとすれば,これよりも勝敗が偏る確率,すなわち 10 戦してどちらか一方が 2 勝以下しかできない確率は 11.0% である。よって,H0 は棄却されず (P > 0.05),ハカリさんがスベルさんに対してジャンケンで勝つ確率が 1/2 でないとは言えない。

 とりあえずこれだけで,試験での回答など、人に説明する場合には十分なのである。論文などではもっと簡略化して、
「ハカリさんはスベルさんとジャンケンして 8 勝 2 敗だった。ハカリさんがスベルさんに対してジャンケンで勝つ確率は 1/2 より有意に大きくはなかった(二項検定P > 0.05)。」
だけでお終いである。

 しかしこの背後には,膨大な「暗黙の了解」が潜んでいることに注意する必要がある。
 暗黙の了解(思いついたものだけ):ハカリさんもスベルさんも実在の人物である。ジャンケンでは必ず勝敗が定義できる。ハカリさんが勝つ確率が,ハカリさんとスベルさんが無限にジャンケンを繰り返した場合のハカリさんの勝率として想定できる。ハカリさんが勝つ確率は時間の経過によらず不変である。ある勝負の結果がそれ以前の勝負の結果により影響を受けることはない。ハカリさんがスベルさんとジャンケンして 8 勝 2 敗だった,という観測結果は,ジャンケンの勝敗の定義に照らして完全に正しい。危険率が 5% より大きい場合には,仮説を採択してはならない。

 こうした暗黙の了解の中には,自明に見えるものも,やや首を傾げるものもあるだろう。また,その了解が崩れた場合に,検定に大きな影響を及ぼすものも,そうでないものもある。そこで,検定結果を否定したい場合には,こうした暗黙の了解の中で,暗黙の了解が実は誤りである可能性があり,かつそのことが検定結果に大きな影響を及ぼし得るものを見つけ出して,その部分を批判すればよい。
 例として「ある勝負の結果がそれ以前の勝負の結果により影響を受けることはない」という部分を検討してみる。もし,ハカリさんがスベルさんにジャンケンで勝つ確率がそれ以前の勝負に影響を受け,連勝や連敗が極めて起こりやすい,ということがあったとしよう。その場合には,偏った勝敗が得られる確率はもっと大きなものになるはずである。仮に危険率が 5% より僅かに小さく,かろうじて帰無仮説 H0 が棄却されていたとすれば,検定結果が覆ることも十分起こり得る。
 しかし科学の世界には,「ある事柄を説明するのに、必要以上の仮説を立ててはならない」という基本的な考え方がある。この考え方を、オッカムの剃刀と呼んでいる。ここで扱ったジャンケン勝敗の仮説 H1 および帰無仮説 H0 は,考えうる限り最も単純な仮説に基づいている。連勝や連敗が起こりやすいと考える十分な理由ない場合には,そうした余分な仮説を持ち込まない方がよいのである。

 以上で述べた暗黙の了解について、統計的検定を行う通常の場面では、意識の底に沈めておいてもほとんど問題は生じないであろう。もちろん、「一旦理解した上で」である。そして、自分あるいは他人が行った統計的検定に違和感を覚えたときには、改めて暗黙の了解を意識の上に引き上げて検討の対象にすればよいのである。言うは易し、行なうは難し、ではあるが。


問題 2-1
 問題 1-1 の結果について,上記枠内、および「 」内と同様の書き方で対立仮説と検定結果を記述してみよ。

2. 二項検定と二項分布

 これまで扱ってきた検定の方法を二項検定という。これは事象が起こる確率を二項分布に近似する方法である。1. の枠内の帰無仮説 H0 では,ジャンケンで勝つ確率 1/2 を仮定したときに 10 回のジャンケンで勝つ回数の分布を,生起確率 p = 1/2,試行回数 N = 10 の二項分布
B(1/2, 10)
に従うものと仮定しているのである。
 二項分布の確率関数は次の式で表される。

ただしP(x) は確率関数,p は事象の起こる確率,q は事象が起こらない確率 (=1 - p),n は試行回数,x は事象が起こる回数 (x = 1, 2,…, n)である。二項分布の確率関数のグラフを 4 例ほど示しておく。
 二項検定に利用されることが多いのは,圧倒的に p = 1/2 の二項分布である。この場合,上記の確率関数の式は

と単純化できる。

 さて,いよいよこの検定法を,実際の生物学のデータに使ってみることにする。

 アユ Plecoglossus altivelis は一般に,川で産卵し,稚魚が海へ下って成長する(海産アユ)。ところが琵琶湖産のアユ(湖産アユ)では,稚魚が琵琶湖流入河川から琵琶湖に下って成長するか,産卵を含めた一生を琵琶湖の中で過ごすかのいずれかである。琵琶湖産アユの稚魚は塩分に対する耐性が低く,またいくつかの形質について海産アユと異なっているため,亜種レベルで分けた方がよいのではないか,という意見も聞かれる。この湖産アユを,全国の河川に持っていって遊魚などのために放流している。
 アユは河川に定着すると,礫の多い場所になわばりをつくることが多い。餌の付着藻類を確保するためである。そしてなわばりに他のアユが侵入すると,体当たりをして追い出すのである。この行動を利用したアユの漁法が「友釣り」である。これは,掛け鈎をつけた囮アユをなわばりに送り込み,なわばりアユが体当たりをしてきたところを引っ掛けて釣り上げる,という漁法である。
 さて,釣り師の間で,湖産アユの方が海産アユよりも囮の追いが良い,つまり囮アユを強く攻撃する,と囁かれている。これを確かめるために,次の例題の実験をした研究者がいる。

例題 2-1
 井口・内田 (1992) は,体長がほぼ同じ(体長差2%以下)海産アユと湖産アユを同じ水槽内に入れて対戦をさせ,どちらが優位になるかを判定した。すると,39回の対戦のうち,琵琶湖産が優位になったのが21回,引き分けになったのが15回,海産が優位になったのが3回であった。この結果から,体長が同程度であれば,琵琶湖産アユの方が海産アユよりも対戦で優位になる傾向があったといえるか。

まず,対立仮説を設定する。
H1 :同サイズの湖産アユ対海産アユの対戦では,どちらかが勝つ確率が高い傾向がある
H0 :同サイズの湖産アユ対海産アユの対戦では,どちらの勝つ確率も同じ 1/2 である。

 この実験結果では引き分けが多い。アユは付着藻類を餌としており,餌場の周辺になわばりをつくって侵入者を排除する。しかしなわばりを防衛する行動には個体差があり,なわばりを十分に確保できる状況でもなわばりを作らず,群れて暮らす個体もある。したがって,個体間で闘争にならない,あるいは闘争があっても決着がつくところまで続かないということもしばしば起こってくるのである。
 ここでは,対戦での優劣を問題にしているので,引き分けはなかったものとして考える。つまり,琵琶湖産が優位になった21回と,海産が優位になった3回の間に有意差があるかを検討すればよい。
 もし琵琶湖産と海産の間で対戦の優劣に傾向がないとすれば,優劣が決した24回のうち,海産のものが優位になることが3回以下になる確率は,次の通りである。
0回:(1/2)24 = 0.00000  1回:24C1・(1/2)24 = 0.00000  2回:24C2・(1/2)24 = 0.00002  3回:24C3・(1/2)24 = 0.00012
ただし,同様の偏りとして,海産のものが優位になることが21回以上になる確率も考えなければならない。
24回: (1/2)24 = 0.00000  23回:24C23・(1/2)24 = 0.00000  22回:24C22・(1/2)24 = 0.00002  21回:24C21・(1/2)24 = 0.00012
これらを全て合わせても,確率はおよそ0.0003,つまり約 0.03 %に過ぎない。したがって帰無仮説は棄却され (P = 0.0003),琵琶湖産アユが海産アユより優位になる有意な傾向が認められた。

 なお,標本数が多く,二項分布の確率を直接計算することが困難な場合には,以下の判別条件を用いる。

k:事象が起こった回数,:試行回数,p :事象の起こる確率,q :事象が起こらない確率 (=1 - p))
 特に p = 1/2 の場合には,


 この判別条件に従う場合,帰無仮説,すなわち事象が起こる確率が p であるという仮説が,危険率 5% 以下で棄却される。

 なお,この判別条件は標準正規分布近似に基づいており(標準正規分布ついては後に学ぶ),n の値が大きいほど良い近似となる。一方,n の値が概ね 25 よりも小さい場合には,この近似は誤差を生じやすいので,面倒でも確率を直接計算した方が良い。

問題 2-2
 例題 2-1 を,近似式による判定条件を用いて検定してみよ。

問題 2-3
 西村 (1987) は,1974年8月から1977年6月の間に,円山川中流域の加都付近でヒゲナガカワトビケラの羽化直前の蛹を49回にわたり採集した。採集された蛹のうち,雌が168個体,雄が158個体だった。採集時に雌雄の個体がよく混ざっており,かつ採集効率が雌雄で同じだったとすれば,調査地点周辺に生息していたヒゲナガカワトビケラの蛹には,雌雄の比に偏りがあったといえるか。

3.符号検定

 符号検定は,対応した2組の標本の大小関係を検定する方法で,計算方法は二項検定と全く同じである。

 NK 細胞は,体内で常につくりだされる癌細胞を早期発見し攻撃することで癌の発病を防いでいる。近年,NK 細胞の活性が精神状態の影響を受け,特に笑いが NK 細胞の活性を高めるという研究結果が知られるようになった。以下はその1例である。

例題2-2
 西田・大西 (2001) は,被験者 26 人に落語を聞かせ,その直前 30 分以内と直後 30 分以内に NK 細胞活性(相対値%)を測定した。以下はその結果である。
71 70 68 67 66 66 65 61 60 60 59 59 58 58 57 50 50 50 49 47 42 42 40 38 31 29
69 69 71 63 71 69 70 58 65 56 64 55 70 69 56 67 57 49 46 51 52 46 46 46 36 32

 この結果から,落語を聞いた後に NK 細胞の活性が上昇する傾向があったと言えるか。

まず,対立仮説を設定する。
H1 :落語を聞いた後に NK 細胞の活性が上昇または下降する傾向がある
H0 :落語を聞いた後に生じる NK 細胞の活性変化に傾向はない
 やはり,実験計画段階での仮説設定なので,「上昇する」とせず「上昇または下降する」傾向があるとした。また,帰無仮説はこれに対する否定なので「変化しない」ではなく「傾向はない」である。

この場合にも,NK 細胞活性が増加した被験者に+,減少した被験者に-の符号を与え,これに対して二項検定を適用することができる。それぞれの被験者に与えられる符号は,
71 70 68 67 66 66 65 61 60 60 59 59 58 58 57 50 50 50 49 47 42 42 40 38 31 29
69 69 71 63 71 69 70 58 65 56 64 55 70 69 56 67 57 49 46 51 52 46 46 46 36 32
符号 - - + - + + + - + - + - + + - + + - - + + + + + + +

すなわち,+が17人,−が9人である。N >25 なので,判別条件

を適用すると,

なので,条件にあてはまらない。
 したがって,落語を聞いた後に NK 細胞の活性が上昇する傾向があったとは言えない (P > 0.05)。

問題 2-4:例題のデータのうち,落語を聞くことによって「笑いを強く実感した」と判定された被験者13人のみについて見ると,NK 細胞の活性変化は以下の通りになった。
67 60 60 59 58 58 47 42 42 40 38 31 29
63 65 56 64 70 69 51 52 46 46 46 36 32

以上の結果から,落語を聞いて笑いを強く実感した後に,NK 細胞の活性が上昇する傾向があったと言えるか。

本日のキーワード:対立仮説有意、オッカムの剃刀二項検定二項分布確率関数符号検定