環境統計学  第1回

2004年4月13日 大塚泰介

0. 参考書の紹介

「生物統計学入門-具体例による解説と演習-」 石居進 著,培風館,1975年,2300円
 古い本だが,生物などの研究者が実際によく用いる統計手法を中心に,理論的な側面にも配慮して解説している。将来,自分の研究結果を統計解析するときに,役に立つ可能性が大。

「統計のはなし-基礎・応用・娯楽-」 大村平 著,日科技連,1969年,1600円
 入門書というより一般向けの読み物という意識で書かれており,表現や例が日常的でわかりやすい。自習書として優れている。

「ゼロから学ぶ統計解析」 小寺平治 著,講談社,2002年,2500円
 統計の数理的な側面についての解説がたいへん充実しており,かつ(他に比べて)わかりやすく書かれている。数学が嫌いでない人は読んでおくと,統計学についての理解がより深まるだろう。

1. 統計的検定は論証の技術

 「ジャンケンが強い人」というのがいる。(初っ端からこんな話で申し訳ない)
 スベルさんとハカリさんの新婚夫妻は,家で一緒に飲むためのコーヒーを淹れる時,必ずジャンケンをし,負けた方がコーヒーを淹れることにしている。しかしスベルさんは,どうも自分の方が負けてコーヒーを淹れるはめになる事が多いように感じている。ついにハカリさんに対して「オマエはジャンケンが強すぎる。ジャンケンでコーヒー当番を決めるのは不公平だ。負担均等の原則に反する」などと口走ってしまった。これに対してハカリさんは,一瞬ムッとしたものの,すぐに涼しい顔に戻って「そんなのは偶然よ。アナタの考え過ぎ。」と答えた。
 そこでスベルさん,コーヒー当番がかかっている時のハカリさんとのジャンケンの勝敗を密かに記録することにした。この夫婦はほぼ毎日のようにジャンケンをしてコーヒー当番を決めていたので,2週間後には10戦分の記録がたまった。それを見ると,
スベルさんの勝ち:2 回
ハカリさんの勝ち:8 回
となっていた。
 さて,この結果から,ハカリさんが「ジャンケンが強い」ことを証明できるのだろうか。

 まず考えなければならないのは,ここで問題になっている「ジャンケンに強い」とはどういうことか,である。まず,ここではハカリさんの対戦相手は常にスベルさんであって,他の相手は想定されていない。つまり,「ハカリさんが強い」のか,「スベルさんが弱い」のか,はたまた「ハカリさんはスベルさんに対して相性がよい」だけなのかは,対戦結果からは判断できないのである。対戦結果から言えるのは,「ハカリさんがスベルさんにジャンケンで勝つ確率が,1/2 より高いかもしれない」ということだけである。
 次に問題になるのは偶然性である。ハカリさんはスベルさんの申し立てに対して「そんなのは偶然」と切って捨てた。例えばスベルさんがハカリさんにジャンケンで勝つ確率がちょうど 1/2 だったと仮定しても,スベルさんがハカリさんにジャンケンで 2 連敗する確率は 1/4,3連敗する確率だって 1/8 あるのだ。ハカリさんがスベルさんに勝敗のデータを見せられて,「ハカリの方が勝率が高いじゃないか」と言われたとしても,「もし私がアナタにジャンケンで勝つ確率が 1/2 だったとしても,10 戦のうち偶然 8 勝するくらいのことはあるわよ」と答えるのではないだろうか。

 そこでスベルさん,自らの仮説を証明するために,以下のような論理をこしらえた。

1. ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 だったと仮定する。
2. 1. の前提が正しいとすれば,どちらかが 10 戦して 8 勝以上もすることはあり得ない。
3. したがって,スベルさんがハカリさんにジャンケンで勝つ確率は 1/2 でない。
4. ハカリさんはスベルさんに 10 戦中 8 勝しており,観測された勝率は 1/2 より大きいので,ハカリさんがスベルさんにジャンケンで勝つ確率は 1/2 よりも大きい。

 この論理は,少なくとも 3 までは背理法を用いた妥当な構成になっている。3. では,スベルさんがハカリさんにジャンケンで勝つ確率は,「1/2 か 1/2 でないかのどちらか一方」であり,「1/2 でかつ 1/2 でない」ことや「1/2 でも 1/2 でなくもない」ことはありえないことを利用して, 2. で生じる矛盾から 1. を否定している。また,証明すべき仮説を「ハカリさんが」ではなく「どちらかが」 10 戦して 8 勝以上もすることはあり得ない,としているのは,勝つ確率が 1/2 でないことには,勝つ確率が高いのがハカリさんの場合のほかに,スベルさんの方が高いという場合もありえるからである。
 この例のように,事象 A の否定 Ā を正しくつくると,「A か Ā のどちらか一方」が正しく,「A でかつ Ā」やことや「A でも Ā でもない」ことはありえないことになる。これを排中律という。そして,上記の論理における「ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 である」のように,仮説 A を背理法によって証明するために仮説の否定 Ā を用意する場合,この Ā を帰無仮説と呼んでいる。

 しかし上の「証明」には問題点がある。
 まず 2. での「10 戦して 8 勝以上もすることはあり得ない」という言明が偽である。勝つ確率が 0 でない限り,10連勝する可能性だって,あるいは100連勝する可能性だって,皆無とは言えないのだ。
 次に 4. で「観測された勝率は 1/2 より大きいので,ハカリさんがスベルさんにジャンケンで勝つ確率は 1/2 よりも大きい」というのも変である。勝つ確率がどんなに小さくても,実際の勝率が 1/2 を上回る事はありえるのである。

 そのことに気付いたスベルさん,自らの仮説の完全な証明を諦め,蓋然性(確からしさ)を訴える方針に変更した。

1. ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 だったとする。
2. 1. の前提が正しいとすれば,どちらかが 10 戦して 8 勝以上もすることは,○○% の確率でしか起こらない。
3. したがって,スベルさんがハカリさんにジャンケンで勝つ確率は 1/2 でない可能性が高い。
4. ハカリさんはスベルさんに 10 戦で 8 勝しており,観測された勝率は 1/2 より大きいので,ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 より大きい可能性の方が,1/2 より小さい可能性よりも高い。
5. ゆえに,ハカリさんがスベルさんにジャンケンで勝つ確率は,1/2 よりも大きい可能性が高い。

 かなりファジーな論理展開になったが,これをはっきり否定する事は難しいだろう。あとは,○○% のところを埋めればよい。これがあまり大きな数字でなければ,スベルさんの仮説の蓋然性は認められるだろう。

 それでは,○○% のところにはどのような数字が入るのだろうか。
 ジャンケンに勝つ確率が 1/2 で,10戦した場合,1 勝もできない確率は、(1/2)10 = 1/1024 となる。1 勝だけできる場合には,勝つのが 1回目、2回目、…10回目、と10通りの場合があるので、その確率は 10C1・(1/2)10 = 10/1024。同様に勝つのが 2 回の場合を考えると、その 2 回がどこで起こるかの組み合わせが 10・9/2 = 45 通りあるので、確率は 10C2・(1/2)10 = 45/1024。以下,同様に考えると、
3回:10C3・(1/2)10 = 120/1024  4回:10C4・(1/2)10 = 210/1024  5回:10C5・(1/2)10 = 252/1024  6回:10C6・(1/2)10= 210/1024
7回:10C7・(1/2)10 = 120/1024  8回:10C8・(1/2)10 = 45/1024  9回:10C9・(1/2)10 = 10/1024  10回:(1/2)10 = 1/1024  となる。

 次に、勝つ回数がx 回以下の確率、つまり累積確率を計算してみると
0回:1/1024 = 0.001  1回:(1 + 10)/1024 = 0.011  2回:(1 + 10 + 45)/1024 = 0.055
(以下計算省略) 3回:0.172  4回:0.377  5回:0.623  6回:0.828  7回:0.945  8回:0.989  9回:0.999  10回:1.000

 したがって,ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 だったとするとき,ハカリさんが 10 戦して 8 勝以上する確率は 5.5%,逆にスベルさんが 8 勝以上する確率も 5.5% である。合わせて 11.0%。したがって,先ほどの空所を埋めると,
2. 1. の前提が正しいとすれば,どちらかが 10 戦して 8 勝以上もすることは,11.0% の確率でしか起こらない。
ということになる。これにて一件落着。やはりハカリさんがスベルさんとのジャンケンに勝つ確率は,1/2 より大きかったのだ…。

 ちょっと待て,と言いたくなる人も少なくないだろう。この 11.0% は,誤った仮説を受け入れてしまう危険性の大きさを示す数値なので,危険率と呼ばれている。危険率 11.0% ということは,スベルさんがハカリさんにジャンケンで勝つ確率が 1/2,つまりスベルさんの仮説が誤っており帰無仮説の方が正しかったとしても,10 回に 1 回以上の割合でそういうことが起こる,ということである。これで「蓋然性が明らかになった」と言われても,納得がいかないのでは?
 実は,確率が何%以下であれば蓋然性の証明になるかについての明確な基準はないのである。確率 30% でも納得がいくという人もいるだろうし,確率 1% でも納得いかない人には納得いかないだろう。
 しかし,人によって規準が違っていては,この議論の蓋然性を客観的に判定することができなくなってしまう。そこで統計学の世界では一般に,5% を規準としている。つまり,危険率が 5% 以下であれば,とりあえず蓋然性が証明されたことにしている,つまり仮説を採択しているのである。一方,危険率が 5% より大きい場合には,帰無仮説の方が正しい可能性を捨てきれないとして,仮説を棄却することになっている。

 残念ながらスベルさんの仮説は,危険率が高すぎたために棄却されてしまった。

問題 1-1
 納得がいかないスベルさん,先ほどの結果をハカリさんに話さず,さらに 2 週間,データを取り続けた。すると,先のデータも含めて,次の結果が得られた。
スベルさんの勝ち:5 回
ハカリさんの勝ち:15 回
この結果から,「ハカリさんがスベルさんにジャンケンで勝つ確率は 1/2 より大きい」ことの蓋然性の証明を再度試みてみよ。こんどは仮説が採択されるだろうか。なお,確率計算が面倒な場合には下の表を用いよ。

20回勝負で,勝つ確率が 1/2 のときの勝ち数の確率分布
勝ち数
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
確率 (%)
.00
.00
.02
.11
.46
1.48
3.70
7.39
12.01
16.02
17.62
16.02
12.01
7.39
3.70
1.48
.46
.11
.02
.00
.00
累積確率 (%)
.00
.00
.02
.13
.59
2.07
5.77
13.16
25.17
41.19
58.81
74.83
86.84
94.23
97.93
99.41
99.87
99.98
100.00
100.00
100.00

 ハカリさんの勝率は若干,下がっているようだが…。

キーワード:確率仮説背理法矛盾否定排中率帰無仮説蓋然性累積確率危険率5%採択棄却