問題の解答

(このページは授業の進行よりやや遅れて更新されます)
問題1-1
 今度は,次の論法により「ハカリさんがスベルさんにジャンケンで勝つ確率が1/2 よりも大きい」ことの蓋然性を示すことができる。
1. ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 だったとする。
2. 1. の前提が正しいとすれば,どちらかが 20 戦して 15 勝以上もすることは,4.14% の確率でしか起こらない。
3. したがって,スベルさんがハカリさんにジャンケンで勝つ確率は 1/2 でない可能性が高い。
4. ハカリさんはスベルさんに 20 戦で 15 勝しており,観測された勝率は 1/2 より大きいので,ハカリさんがスベルさんにジャンケンで勝つ確率が 1/2 より大きい可能性の方が,1/2 より小さい可能性よりも高い。
5. ゆえに,ハカリさんがスベルさんにジャンケンで勝つ確率は,1/2 よりも大きい可能性が高い。

 以上のように,勝率が下がっているにもかかわらず,10 勝 8 敗だったときに 11.0% だった危険率が今度は 4.14% まで下がっており,統計検定における有意差の検出規準を満たすようになった。
 統計検定では,試行回数(あるいは標本数)が大きくなるにつれて,母集団における僅かな違いを有意なものとして検出しやすくなる。有意差が出ないのは多くの場合「差がない」のではなく「差を明らかにできるほど標本数がなかった」ことを意味しているのである。

問題2-1
H1:ハカリさんがスベルさんに対してジャンケンで勝つ確率は,1/2 でない。
H0:ハカリさんがスベルさんに対してジャンケンで勝つ確率は,1/2 である。
 ハカリさんはスベルさんとジャンケンして 15 勝 5 敗だった。H0 が正しいとすれば,これよりも勝敗が偏る確率,すなわち 10 戦してどちらか一方が 5 勝以下しかできない確率は 4.14% である。よって,H0 は棄却され (P < 0.05),ハカリさんがスベルさんに対してジャンケンで勝つ確率は 1/2 よりも有意に大きかった。

「「ハカリさんはスベルさんとジャンケンして 15 勝 5 敗だった。ハカリさんがスベルさんに対してジャンケンで勝つ確率は 1/2 より有意に大きかった(二項検定,P < 0.05)。」

問題2-2
 例題 2-1 では勝敗のついた試行回数 n = 24 なので,厳密にはこの判別条件を使うのは妥当ではない。しかし結果に多少の偏りがあることを覚悟して用いてみる。k = 21 (3 でもよい),n = 24 を式に代入すると,
(|2×21 - 24|-1)/241/2 = 3.47 > 1.96
となり,やはり海産アユが湖産アユより優位になる有意な傾向が認められる (P < 0.05)。

問題2-3
H1:この地域のヒゲナガカワトビケラの羽化直前の蛹では,雌雄の割合が異なる。
H0:この地域のヒゲナガカワトビケラの羽化直前の蛹では,雌雄の割合が等しい。
 「羽化直前の蛹を 49 回にわたり採集した」を見て,試行回数を 49 回と考えると大間違いである。この記述は,サンプリングの季節的な偏りを避けるために少しずつ小分けにして採集した,ということを言っているに過ぎず,検定とは直接の関係がない。
 ここでの試行回数 n は,雌雄の個体数の合計,すなわち n = 168 + 158 = 326 である。事象が起こった回数 k は,雌の個体数 168 でも雄の個体数 158 でもよい。n = 326,k = 168 を式に代入すると,
(|2×168 - 326|-1)/3261/2 = 0.50 < 1.96
となる。
 よって,H0 が正しいとしても,これよりも雌雄の割合が偏る確率は 5% 以上ある。よって,H0 は棄却されず (P > 0.05),雌雄の割合が異なるとは言えない。

問題2-4
H1 :落語を聞いて笑いを強く感じた後に,NK 細胞の活性が上昇または下降する傾向がある。
H0 :落語を聞いて笑いを強く感じた後に生じる,NK 細胞の活性変化に傾向はない。

67 60 60 59 58 58 47 42 42 40 38 31 29
63 65 56 64 70 69 51 52 46 46 46 36 32
符号
-
+
-
+
+
+
+
+
+
+
+
+
+

 標本数(条件に該当する被験者数)が 13 で,全ての標本で NK 細胞の活性が上昇あるいは下降の傾向を示している。もし NK 細胞の活性変化に傾向性がないとすれば,n = 13 のうち,+,- いずれか少ない方の数 k が 2 個以下になる確率は,次の通りである。
+ の数が 0個:(1/2)13 = 0.0001  1個:13C1・(1/2)13 = 0.0016  2個:13C2・(1/2)13 = 0.0095  
- の数が 0個:(1/2)13 = 0.0001  1個:13C1・(1/2)13 = 0.0016  2個:13C2・(1/2)13 = 0.0095
合計:0.0225 = 2.25%
 すなわち,H0 が正しいとすれば,これよりも符号の割合が偏る確率は 2.25% しかない。従って,落語を聞くことによって笑いを強く実感した後には,NK 細胞の活性変化は上昇する有意な傾向が見られた (P = 0.0225)。

問題3-1
H1 :日本の一級河川では,1996 年より 1998 年に BOD 値 (75% 点) が低い,あるいは高い傾向があった。
H0 :日本の一級河川では,1996 年より 1998 年に BOD 値 (75% 点) が低い,あるいは高いいずれの傾向もなかった。

河川 美幌川 北上川 隅田川 阿賀野川 天竜川 東高瀬川 由良川 旭川 古川 小瀬川 仁淀川 川内川
地点 美幌橋 船田橋 岩淵水門 松浜橋 中央橋 三須橋 以久田橋 合同堰 大下 大和橋 八田堰 栗野
1996年 1.3 0.9 6.2 0.7 3.2 2.1 0.8 0.8 2.5 3.2 0.9 0.8
1998年 2.0 0.9 5.4 0.8 2.4 1.8 0.7 0.8 2.0 2.8 0.7 0.5

0.7
0
-0.8
0.1
-0.8
-0.3
-0.1
0
-0.5
-0.4
-0.2
-0.3
符号
+

-
+
-
-
-

-
-
-
-
差の絶対値
0.7

0.8
0.1
0.8
0.3
0.1

0.5
0.4
0.2
0.3
絶対値順位
8

9.5
1.5
9.5
4.5
1.5

7
6
3
4.5

+ 側の順位和:1.5 + 8 = 9.5
- 側の順位和:1.5 + 3 + 4.5 + 4.5 + 6 + 7 + 9.5 + 9.5 = 45.5
順位和の小さい方を T とする。すなわち T = 9.5
 表に上がっている 12 地点のうち,BOD に差があったのは 10 地点である。よって N = 10。
「Wilcoxon の符号順位検定の数表(P = 0.05,両側検定)」を見ると,N = 10 のとき T = 8。計算された T = 9.5 はこれよりも大きいので,P > 0.05 で帰無仮説は棄却されない。よってこの結果だけからは,日本の一級河川で 1996 年より 1998 年に BOD値 (75% 点) が低い傾向があったとは言えない。

 ただし,もう少し多くのデータを用いて検定していたならば,検定結果は違ったものになっていた可能性が高い。「証拠不十分」により帰無仮説を棄却できなかったのだと考えるべきであろう。

問題3-2
H1 :右利きの日本人は右手の方が左手より大きい,あるいは小さい傾向がある。
H0 :右利きの日本人は左右どちらの手が大きい傾向もない。

右利きの人のデータだけを表から抜き出すと,次のようになる。
右手の長さ (mm)
173
175
165
188
175
183
173
171
198
194
189
189
181
178
左手の長さ (mm)
169
175
165
189
180
189
168
171
200
191
183
191
182
183
差(右手 - 左手)
4
0
0
-1
-5
-6
5
0
-2
3
6
-2
-1
-5
符号
+


-
-
-
+

-
+
+
-
-
-
差の絶対値
4


1
5
6
5

2
3
6
2
1
5
絶対値順位
6


1.5
8
10.5
8

3.5
5
10.5
3.5
1.5
8

+ 側の順位和:5 + 6 + 8 + 10.5 = 29.5
- 側の順位和:1.5 + 1.5 + 3.5 + 3.5 + 7 + 9 +10.5 = 36.5
順位和の小さい方を T とする。すなわち T = 29.5
 右利きの 14 人のうち,左右の手の長さに差があったのは 11 人である。よって N = 11。
「Wilcoxon の符号順位検定の数表(P = 0.05,両側検定)」を見ると,N = 11 のとき T = 11。計算された T = 29.5 はこれよりも大きいので,P > 0.05 で帰無仮説は棄却されない。よってこの結果からは,右利きの人は左右どちらの手が大きい傾向があるとも言えず,「右利きのひとは右手を多く使うので,左手に比べて右手が大きくなる」という説は支持されない。


H1 :日本人は利き手の方が非利き手より大きい,あるいは小さい傾向がある。
H0 :日本人は左右どちらの手が大きい傾向もない。

左利きの人のデータを加えて,利き手 - 非利き手の関係としてまとめると,次のようになる。
利き手の長さ (mm)
173
175
165
188
175
183
173
171
198
194
189
189
181
178
167
176
非利き手の長さ (mm)
169
175
165
189
180
189
168
171
200
191
183
191
182
183
167
178
差(利き手 - 非利き手)
4
0
0
-1
-5
-6
5
0
-2
3
6
-2
-1
-5
0
-2
符号
+


-
-
-
+

-
+
+
-
-
-

-
差の絶対値
4


1
5
6
5

2
3
6
2
1
5

2
絶対値順位
7


1.5
9
11.5
9

4
6
11.5
4
1.5
9

4

+ 側の順位和:6 + 7 + 9 + 11.5 = 33.5
- 側の順位和:1.5 + 1.5 + 4 + 4 + 4 + 9 + 9 + 11.5 = 44.5
順位和の小さい方を T とする。すなわち T = 33.5
 16 人のうち,左右の手の長さに差があったのは 12 人である。よって N = 12。
「Wilcoxon の符号順位検定の数表(P = 0.05,両側検定)」を見ると,N = 12 のとき T = 14。計算された T = 33.5 はこれよりも大きいので,帰無仮説は棄却されない (P > 0.05) 。よってこの結果からは,左右どちらの手が大きい傾向があるとも言えない。

問題3-3
 判別規準の式に T = 60,N = 26 を代入すると,
(60 - 26×27/4 - 1/2)/(26×27×53/24)1/2 = -2.95
この値は -1.96 よりも小さいので,帰無仮説は棄却される (P > 0.05) 。よって落語を聞いた直後には,落語を聞く直前よりも NK 細胞活性が高くなる有意な傾向があったという結果が,判定式からも確かめられた。

問題4-1
H1:産卵のために水田に遡上してきた雌ナマズの体長分布は,4月下旬と6月上旬で異なる。
H0:産卵のために水田に遡上してきた雌ナマズの体長分布は,4月下旬と6月上旬で異なる。

 全体の中で体長が小さいものから順に順位をつけると,
4月下旬:4位, 8.5位, 10位, 11位, 15位, 16位                          →順位和 64.5
6月中旬:1位, 2位, 3位, 5位, 6位, 7位, 8.5位, 12位, 13位, 14位, 17位, 18位, 19位, 20位→順位和 145.5
標本数がより少ない 4月下旬の順位和 64.5 を統計量とする。
一方,Wilcoxon の順位和検定の数表で N1 = 6, N2 =14 のところを見ると,38/88。算出された順位和はこの範囲内にあるので,帰無仮説 H0 は棄却されず,産卵のために水田に遡上してきた雌ナマズの体長分布は 4 月下旬と 6 月上旬で異なるとは言えない (P > 0.05)。

問題5-1
H1Encyonema silesiacumEncyonema simile の殻幅の分布は同じである。
H0Encyonema silesiacumEncyonema simile の殻幅の分布は同じである。

 全体の中で体長が大きいものから順に順位をつけると,
Encyonema silesiacum:1.5位, 1.5位, 3位, 4位, 5位, 6位, 7.5位, 7.5位, 15.5位, 15.5位→順位和 67(平均順位 6.7位)
Encyonema simile:9位, 10位, 11位, 12位, 13.5位, 13.5位, 17位, 18位    →順位和 104(平均順位 13位)
平均順位がより小さい E. silesiacum について,U 統計量を計算すると,
U = 67 - 10×(10+1)/2 = 12
一方,Mann-Whitney の U 検定の数表で N1 = 10, N2 =8 のところを見ると,U = 17。算出された順位和はこれより小さいので,帰無仮説 H0 は棄却される (P < 0.05)。よって,両者の殻幅の分布は異なっており,E. silesiacum の方が殻幅が大きい有意な傾向が認められた。

問題5-2
H1:カワムツとオイカワでは側線鱗数の分布に違いがある。
H0:カワムツとオイカワでは側線鱗数の分布に違いがない。

 側線鱗数の測定値を改めて示すと,
カワムツ:47, 47, 48, 50, 50, 50, 50, 51, 51, 52, 52, 52
オイカワ:43, 43, 43, 43, 44, 45
 全体の中で少ない方から順位をつけると,
カワムツ:7.5位, 7.5位, 9位, 11.5位, 11.5位, 11.5位, 11.5位, 14.5位, 14.5位, 17位, 17位, 17位→順位和 150(平均順位12.5位)
オイカワ:2.5位, 2.5位, 2.5位, 2.5位, 5位, 6位                            →順位和  21(平均順位 3.5位)
平均順位がより小さいオイカワについて,U 統計量を計算すると,
U = 21 - 6×(6+1)/2 = 0
一方,Mann-Whitney の U 検定の数表で N1 = 6, N2 = 14 のところを見ると,U = 17。算出された順位和はこれより小さいので,帰無仮説 H0 は棄却される (P < 0.05)。よって,両者の側線鱗数の分布は異なっており,カワムツの方が側線鱗数が多い有意な傾向が認められた。

問題6-1
 Sidak の方法をこの例に適用するならば,20 回検定を繰り返した場合に 1 回以上有意差が検出される確率が 5% になるように確率を設定すればよい。すなわち
1 - (1-α)20 = 0.05
となるαを,有意差を検出するための危険率の基準とする。
(1-α)20 = 1 - 0.05 = 0.95
1-α = 0.951/20
α = 1 - 0.951/20 = 0.00256
 すなわち,危険率 P < 0.00256 = 0.256% のときに帰無仮説を棄却すればよい。

問題6-2
A:片側検定を適用できるかどうかは,どのような社会を調査するかによって決まる。
 多くの地域においては,男性のほうが女性よりも体重が大きい傾向があるのは確かである。従って片側検定でよいと考えられる。しかし女性は体重が大きいほど尊重され,男性はそうでないという価値観が浸透している地域では,女性の体重が男性より大きい傾向が生じてくる可能性も十分に考えられる。そもそも,男性のほうが体重が大きい傾向があるという「常識的な」結果が期待される地域では,男女の体重分布の差を検定しようなどと考えないのではないか。

B:片側検定を適用できるかどうかは,あなたがビワコオオナマズの雌が雄よりも大きい傾向があることを知っていて,かつそのことを他人に対して説得力をもって説明できるかによる。
 ビワコオオナマズは雌の方が大きい傾向があることについては,既に多くの書物に書かれている。また,ビワコオオナマズの産卵を見たことがあれば,大きな雌にそれより小さな雄が巻きついて産卵していることから,雄の方が小さいという予想を立て,かつそれを説明することができるだろう。しかしあなたがこうした事実を知らなかったり,知っていても十分な説得力をもって他人に説明できないときには,両側検定を用いておいた方が無難だろう。

C:この検定を適用するための実験そのものが実行不可能かもしれない。
 ザ・ドリフターズのコントによる笑いは一般性が高く,文化や世代背景にあまり関係なく笑えるという評価がある。この見解に従うならば,ザ・ドリフターズのコントを見た後には NK 細胞の活性が高くなる傾向がある可能性が大きく,逆に低くなる可能性は無視してもよいと考えられる。そのような研究はこれまで行われて来なかったので,これからこの仮説を検証するための実験をすることを考えることになる。しかし残念ながら,リーダーであるいかりや長介の死去により,既に5人揃ったザ・ドリフターズのコントをライブで見せて実験を行うことは不可能である。往年のザ・ドリフターズのコントを録画で見せることで実験の遂行は可能だろうが,被験者の様々な記憶が実験結果に影響を及ぼす可能性は否定できない。

問題7-1
 平均は,(1+3+40+215+53+6+2)/24 = 13.3 (細胞/ml)。これは全 24 測定値の 3 位と 4 位の間に相当する。
 8 位以降が全て 0 なので,12 位と 13 位の値の平均値にあたる中央値は 0 (細胞/ml)。

問題7-2
 2, 4, 4, 8, 8, 8, 8, 16, 16, 32 についてそれぞれ 2 を底とした対数をとると,log2 2n = n なので,
1, 2, 2, 3, 3, 3, 3, 4, 4, 5 この平均をとると,
 (1+2+2+3+3+3+3+4+4+5)/10 = 3 これが対数変換した相乗平均 log2G となるので
  log2G = 3 すなわち相乗平均 G = 8

問題7-3
直径 4.0〜4.2
〜4.4
〜4.6
〜4.8
〜5.0
〜5.2
〜5.4
〜5.6
〜5.8
〜6.0
〜6.2
合計
階級値 4.1 4.3 4.5 4.7 4.9
5.1 5.3
5.5
5.7 5.9
6.1
細胞数(度数)
2 5 6 11 7
7 4
4
2 1
1 50
累積度数
2
7
13
24
31
38
42
46
48
49
50

階級値×度数
8.2
21.5
27
51.7
34.3
35.7
21.2
22
11.4
5.9
6.1
245
(階級値)2 ×度数
33.62
92.45
121.2
242.99
168.07
182.07
112.36
121
64.98
34.87
37.21
1211.06

平均は,245/50 = 4.9(μm)
中央値は,25 位,26 位ともに階級値 4.9 の階級に属するので,4.9(μm)
最頻値は,最も多い 11 細胞が属する階級の階級値なので,4.7(μm)
不偏分散は,(1211.06 - 50×4.92)/49 = 0.216(μm2) なので,標準偏差は,0.2162 = 0.46(μm)
第一四分点は,上位から数えて 25%,すなわち下位から数えて 75% に位置する標本の値なので,38 位 の標本が属する階級の階級値 5.1(μm)。
第三四分点は,上位から数えて 75%,すなわち下位から数えて 25% に位置する標本の値なので,13 位 の標本が属する階級の階級値 4.5(μm)。

 測定された細胞は全て直径が 4.0〜6.2 μm の範囲にあるので,より多くの細胞を測定したとしても,その大部分は直径 3.2〜6.6μm の範囲に収まると考えられる。すなわち,宍道湖産Microcystis sp. は,細胞直径から見る限り,日本産 Microcystis aeruginosa の範疇に収まっていると見てよい。

問題7-4

不偏分散の補正値は, su2 = s2 - I2/12 = 0.216 - 0.22/12 = 0.212(μm2)
標準偏差の補正値は,これの平方根なので,0.2122 = 0.46(μm)
すなわちこの場合には,補正による値の変化は非常に小さい。

問題8-1


xi f(xi) = μ,f(xi) = 1 であることを利用している。

問題9-1
 n = 144, p = q = 1/2 を
(|k - np| -1/2)/(npq)1/2 < 1.96
に代入して k の範囲を求めると,
(|k - 144×1/2| -1/2)/(144×1/2×1/2)1/2 < 1.96
|k - 144×1/2| -1/2 < 1.96×(144×1/2×1/2)1/2
|k - 72| < 1.96×6 +1/2 = 12.26
-12.26+72 < k < 12.26+72
59.74 < k < 84.26
k は整数なので,  60≦k≦84
すなわち,このチームの勝ち数の 95% 信頼区間は,60勝から84勝までの範囲である。

問題9-2
 求める 95% 信頼区間は,
m±1.96s/n1/2
これに m = 0.91,s = 1.16,n = 378 を代入して,
0.91±1.96×1.16/19.44 = 0.91±0.12
すなわち,キャベツ一株あたりのモンシロチョウ卵数の期待値(母平均)は,0.79 個から 1.03 個の範囲にあると推定される。

問題10-1
 求める 95% 信頼区間は,
m±tn-1(0.975)・s/n1/2
n = 10 なので,t 分布の数表でν= n - 1 = 9 のところを見ると,t9(0.975) = 2.26 となっている。
m = 293/10 = 29.3。また,s2 = (11873 - 29.32×10)/(10-1) = 365 なので,s = 3651/2 = 19.1
以上を 95% 信頼区間の式に代入すると,
29.3±2.26×19.1/101/2 = 29.3±13.7
すなわち,琵琶湖内湖におけるヨシのシュート密度の期待値は,その 95% 信頼区間が 15.6 本/m2から 43.0 本/m2 までの範囲であると推定される。
 これに,内湖のヨシ帯の全面積 1.97 km2 = 1.97×106 m2 を乗じれば,琵琶湖内湖におけるヨシのシュート総数の 95% 信頼区間が得られる。15.6×1.97 = 30.7,43.0×1.97 = 86.1より, 95% 信頼区間は 3.1×107 本から 8.6×107 本までの範囲であると推定される。

問題11-1

において,定義上,各項の分子 (xi - npi)2 の期待値 E{(xi - npi)2} が xi の分散 V(xi)である。
 xi
が生起確率 pi,試行回数 n の二項分布 B (pi, n) に従うとすると,
E{(xi - npi)2} = V(xi) = npiqi
 したがって X2 の期待値 E (X2) は,


問題11-2
H1:雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差の範囲を超えている。
H0:雑種第2代がもつ形質の割合の理論値からのずれは,偶然誤差の範囲内である。
 総個体数が 612 + 201 + 155 + 50 = 1018 なので,各形質をもつ個体数の理論値は,
(黄体色・正常翅,黄体色・痕跡翅,黒体色・正常翅,黒体色・痕跡翅) = (1018×9/16,1018×3/16,1018×3/16,1018×1/16)
よって X2 統計量は,

一方,自由度ν= 4 - 1 = 3 のχ2 分布の 95% 点は,
χ23(0.95) = 7.81
算出された X2 統計量はこれよりも大きいので,帰無仮説 H0 は棄却され (P < 0.05),雑種第 2 代がもつ形質の割合の理論値からのずれは,偶然誤差を超えている。すなわち,理論値には従っていないと言える。

問題12-1

A = 8, B = 203, C = 36, D = 113 を代入して、φ= -0.31

H1:カイエビとトゲカイエビには、共存または非共存の傾向がある。
H0:カイエビとトゲカイエビの生息は互いに独立であり、共存または非共存の傾向はない。
 帰無仮説に従うときの各セルの期待値を計算すると次のようになる。


カイエビ

存在 不在
トゲカイエビ
存在 44×211/360
316×211/360 211
不在 44×149/360 316×149/360 149

44 316 360
 
よって X2 統計量は,

一方,自由度ν= 1 のχ2 分布の 95% 点は,
χ21(0.95) = 3.84
算出された X2 統計量はこれよりも大きいので,帰無仮説 H0 は棄却され (P < 0.05),カイエビとトゲカイエビの生息は互いに独立でない有意な傾向がある。そして、φ係数が負の値をとっていることからもわかるように、両者には非共存の傾向がみられる。

註:X2 = N×φ2 の関係を用いて X2 統計量を求めてもよいし、その方が容易である。