統計的仮設検定について
まず、帰無仮説というのは否定したい(否定されたとき重要な)仮設であって、自分の意見と異なる常識を指すことに注意する。そして対立仮説とは帰無仮説の否定であって自分の意見をふくむ説弁である。この統計的仮説検定の本質としては、帰無仮説をデータから棄却し対立仮説が正しいと仮定するの帰無仮説が存在しないことを示すことである。
以下の例題を考えてみる。
即ち帰無仮説H_0はm=68とすると
データN=25名の平均71点で
全国データの標準偏差が12点という値を利用して帰無仮説を棄却することを考えたい。
ここで標準偏差について次の点に注意する。
●平均とは違って全国でもこの地域でも標準偏差は変わらないと考え信頼性の高い公表された全国データの標準偏差を採用する。
この考え方を用いてデータ平均の分布を用いると正規分布の形と同じになるのでm=母平均
として標準偏差をデータ数の平方根で割れば分散のとなるのでs/√N=12.0/√25=2.4となる。
ここでH_0が正しいとすると、m=68となり、
これが、危険率5%による仮説検定を行う。
このデータの規準化を行う。
図1の横軸目盛りxを図2の横軸目盛りZに合わせる。
Z=(71-68)/2.4=3/2.4=1.25
とデータ平71のZ値を求められる。
ここで検定結果の出し方として
❶-1.96<Z<1.96となれば、H_0が正しいときも起こりうるデータ平均のであるということになる。即ちこの時はH_0を棄却できなかっということで検定失敗となる。しかしここでH_0が正しいことが立証されたことではないことに注意する。棄却されなかったという意味で極めて消極的な肯定とすることもあるが統計では仮説を肯定することは出来ないということに注意しなければならない。
❷|Z|>1.96のときは、仮説H_0棄却出来たということになり、検定成功となる。
即ち危険率5%のとき、仮説が正しいとき5%だけはH_0を棄却してしまう誤りを認めているということである。これを第1種の誤りという。
よってこの例題に関しては、
(1)では仮説H_0は棄却できなかった。しかし、次の2点が分かることになる。
●その地域の平均は全国平均は全国平均より高かった。
●違いを立証するにはデータが不足していた。
ということが分かるのである。
よって(2)のように、データ不足が原因と考え再調査をする。では(2)を考えてみよう。
再調査のデータ数を予測すると
Z=(71-68)/◯>2
◯=12.0/√N<1.5
√N>12.0/1.5≒10
N≧100
となるので、
N=100とするとデータ平均70.5が得られたとする。
すると、Z=(70.5-68)/12.5/√100=25/12>2
となり、Z>1.96より仮説は棄却できたことになるのである。