誤差のある話
先週、ある学会のために九州まで行ってきた。
学会の内容は非常に有意義でかつ楽しかったのだが、最も印象に残ったのは飲み会だった。
(といってもこれは「勉強コラム」なので、飲み会の与太話ではなく、真面目な話です。ご安心を。)
当日の学会の発表が終わり、先輩方と一緒にあるマイニング系の研究グループの飲み会に参加させていただいた。
そのとき同席させていただいたのが、最近では統計教育に関する研究に力を入れていらっしゃる先生。初めてお会いしたので自己紹介をしながら、先生が発表をされた統計教育関連のセッションの話題を振ってみた。何でも学習指導要領が変わって統計教育が少しずつ重視され始めたらしい。喜ばしいことだと思っていたら先生は開口一番、
「私は、数学の先生がはたして統計を教えることが出来るか、少し不安に思っているのです。」
とのお答え。なぜか分からないという顔をしている私に先生は丁寧に説明してくださった。
「数学のように非常に整合性・一貫性を保った学問と違い、統計はどうしても誤差や残差などの説明しきれない領域が残ってしまいます。それに対して数学的な定理や公式の証明と同様のアプローチをとったときに学生さんが理解してくれるのかどうか。難しいかもしれません。」
なるほど、前に仮説検定の結果が正誤でないという話を書いた直後だったので非常に共感できた。
「確かに統計に代表されるデータサイエンスは数学的な土台の上に成り立っていますが、より実用的な方法論としての側面も持ち合わせているはずです。ですから、統計を数学の授業で教えずに理科や社会科など他の授業で教えるのも効果的かもしれませんね。」
他の先生(だったと思う)がコメントした。確かに統計分野は数理統計などの理論的な側面ばかりではなく、むしろ現実のデータ処理をどのように行うかというのが重視される。その意味では総合科目的な位置づけに置かれるのかもしれない。
その後も九州のおいしいお酒を飲みながら議論は進んでいったが、ここで重視されたのは誤差(あるいは残差)という概念をどのように扱うかということのように思える。
誤差や残差というのは、一般的にはあるモデルや処理(測定などもこれに含まれる)を行ったとき、実データ値と期待される値の間に生じた「差分」である。確かに、昔自分が高校生だったときにこの誤差という概念をどのように説明されたか、全く覚えていない。
その一方で大学を出て就職したら世の中「誤差」だらけのことに気づいた。経済の行く先、企業の業績、卑近なところでは先輩や同輩との付き合い、どれをとっても望ましい「モデル」どおりにはいかず、必ずどこかで誤差が生じた。
もっとまともな話で言うならば、最初の就職先ではソフトウェア開発を行っており、バグ収束の判定にはSQCを使っていたが、モデルどおりにバグが収束せず大変苦労した記憶がある。
自分はこれらの「誤差」をどのように理解し、処理したのだろうか。おそらく「世の中はモデルどおりにいかない。こんなものだ」と何となくあいまいに解釈したのではないかと思う。
教育指導要領で統計が重視されているそうだ。
それならば、是非「誤差のある話」を分かりやすく説明できるものであってほしい、やたらと蒸し暑い九州の夜空を見上げながらつくづくそう思った。