統計勉強Home  >03)勉強コラム > 仮説検定の結論は正誤か?

仮説検定の結論は正誤か?

今回も「気持ち悪い」話からはじめてしまう。(申し訳ありません)

「○○さん、仮説検定で帰無仮説が棄却されたから対立仮説が『正しい』んだよね?」

現在、ある大学のTAをしているが、たまにこのような質問を受ける。感覚的に気持ち悪いので、すぐに言い直す。

「いえいえ、対立仮説は『妥当である』んです。」

自分にあまり学がないのでそれ以上は言わないが、相手は何か不思議な顔をしながら一応納得したような顔を見せてくれる。(ありがたい)

私の中では感覚的に仮説検定というのは意思決定問題、またはモデル選択問題の1種である。というのも、有意水準の値というものが理論的な合理性を持つものではなく、単に経験的に使われている基準値である以上、帰無仮説/対立仮説のどちかをとるかという判断は正しく分析者の主観にゆだねられていると考えるからである。

無論、通常は各分野で慣習的に5%とか1%といった有意水準の基準値が利用され、これに従わない場合は変人扱いされたり、常識はずれ?とみなされるが、「常識的な有意水準で分析を行う」というのも分析者の意思である以上、それが分析者の主観による意思決定の1つであることには間違いない。

この辺はやはり専門家が詳しい。昔勉強した「意思決定の基礎」(松原望先生のもの。旧版しか手元にないけど)の7章を見てみると、ちゃんと「仮説を棄却する→否定する」「採択する→認める」という意思決定の言葉に則った説明がしてあった。さすが分かりやすい統計学!の先生である。

それに加えて前述の通り仮説検定はモデル選択問題の1種である。これは帰無仮説が元々確率モデルであり、ソフトウェアが計算するp値が1種の適合度を示しているという事実を考えれば明らかである。

たまに本屋で見かける入門編の教科書にはこの重要な事実が書いていない。すると、片側検定と両側検定の問題や多重検定などの少し発展した問題を説明できなくなる。結果として統計を勉強する学生は余計分からなくなり、統計勉強達は奇人変人のようにみなされてしまう。

これは、非常に困ることです。

ここまで熱く語るのには訳がある。おなじみ「Wikipedia」の記述を発見してしまったからなのだ。

以下Wikipediaの「仮説検定」の項からの引用。(リンクははずしました)

仮説検定(かせつけんてい)、もしくは統計学的仮説検定 (Statistical hypothesis testing)、あるいは単に検定法とは、ある仮説が正しいといってよいかどうかを統計学的・確率論的に判断するためのアルゴリズムである。

ちゃんと「判断するための」という文言が書いてあるからいいのだろうが、「アルゴリズム」という言い方はどうかな、と思ってしまった。判断するのは分析者(あるいは分析者が選んだ業界的慣習)である以上、何らかの恣意性がそこに存在するはずである。それを機械的作業を連想させるアルゴリズムという言葉を使って説明するのはどうだろうか(ある意味的をえているが)。。。しかも「妥当」ではなく、「正しい」という言葉を使っているし。。


すいません、絡んでしまいました。私、Wikipedia大好きです。これを編集しているボランティアの方も尊敬しています。もっといい表現を見つけたら私も編集に参加したいです。本当に。

ちなみに、私が大好きな「意思決定の基礎」にも少し違和感があるところがある。先ほどの第7章「仮説と仮説検定」で仮説検定を背理法と比較しているところである。

背理法とは本来主張したい仮設と逆の仮説(帰無仮説)を設定し、この帰無仮説を基に論理を進めていくと最低1つの矛盾が生じることを証明することによって本来の仮説の正しさを証明する方法である。つまり、帰無仮説の状態については論理的に正誤の2値しか存在しないし、一旦誤りと判断された仮説にはもはや正しさ(ある種の真実)は少しも存在しないことを前提としている。

ところが、統計的仮説検定は過誤や有意水準いう確率概念を取り入れ、正誤2つの状態の間に人間の意思決定により近いあいまいさを取り入れているのではないか。このあいまいさのお陰で人間が起こす決定ミスを数理の枠組みで評価できる。私はこの確率概念の導入こそ仮説検定をより実践的な技法にしているすばらしいアイディアだと思っている。それを二元論的な視点に基づいた背理法と比較されると少し違和感がある。

もちろん、松原先生もこんなことまで意識はしてなさらなかっただろう。仮説検定を知らない学生に説明を行う際、プロセスとしての背理法との比較は妥当なものであり、教えられる方も分かりやすいと思う。

今日はいたるところで絡んでいます。少し反省します、はい。