『データ分析におけるバラつきの重視傾向について』

 

『データ分析におけるバラつきの重視傾向について』

昨今、特に小学校の算数・中学校の数学の教科書においてデータの読み方・活用においてそのばらつきについて何十年前と比してより詳しく叙述されるようになったように思われる。

もっとも、詳しく見れば、この点は昔から取り扱われないわけではなく、取り扱われ方の比重が変わりつつ教科書に載ってきた経緯はあるようだ。

算数・数学で取り扱われるといっても、統計や確率との連関内容がその主なものになっているのであるが、現代のさまざまなデータを用いる社会に出て役に立つことを想定してのことは、各国とも同様であろう。

つまり、時代の要請ともいえるのである。

現に、学校の定期テスト結果も昔のような単なる平均点だけではなく、分布表を配られる中で、自分がどこにいるのかが明白にわかるようになってきてから久しい。

だから、ただ単に各教科の点数だけを合計するなんてことをやっていた時代は懐かしいくらいである。

かなり昔のことであるが、高校で教えていたとき、テスト結果を分布表につけてみると、平均付近の点がほとんどなく低い点と高い点のところに山が2つできていることもあった。

この解釈は色々とできるが、面白いことに、このような分布になっているのは、教科の違いを越えて、ある特定のクラスであったり、それとは別に、ある特定の教科だけにおいてどのクラスにも共通していたり、さらに、同じ教科内においても学習する内容の違いによっても分布が正規分布に近い場合であったりとか先程の2つの山の分布になったりするのである。

そこでその時は確認できなかったが、当時行われた県下一斉テスト(県立高校と私立高校も含めて実施された、)結果の分布が総計として見てみた場合(※細かく各問題別な観点も含めて)どうなっていたかが気になったのを懐かしく思い出す。

母集団を非常に多くとった場合とそうでない場合とにおいてその分布の仕方が大きく異なってくる場合は当然あるのが普通なのであるが、どこに範囲を絞って捉えるかということもとても重要なことに思える。

データをどこの範囲で使うか、データの信用度の確認、データが何故そうなったかの解釈の問題もなおざりにできない重要な問題であると考えるがいかがなものか?

データを活用するために資料の整理をする便利さを生徒に実感させることはとても必要なことである。

ところでサイコロを振った時、回数が少ないとき、必ずしもある目が出る確率が1/6にならず、ものすごく回数を増やしていくと限りなく「同様に確からしい」という前提のもとに数学的確率に限りなく近づいていくことを実感させるのは、授業時間の関係から難しいのかもしれないのである。

話をあえて面倒くさくする意図はないが、まして、いわんや「同様に確からしい」ということのある程度の確認さえ難しいのである。

翻って、データの分布のバラつきの分析といえども、そのデータの数の範囲の量によっての分布のバラつきのしかたであって、その数を膨大にした場合は上述したサイコロのある目が出る確率が数学的確率に限りなく近づくことのアナロジーとして捉えることがひょっとしてたら、できるのかもしれない。

その場合、とかく敬遠されがちな平均値の意味もまんざら捨てたものではない気もする。(※母集団を膨大にしていくと正規分布に近づく場合もある点において)

社会科学においていまだに平均分析がなされているのもそれなりの意味があるように思える。

ただ何回も繰り返したくはないが、より具体的な比較的少数のケースにおいての分布のバラツキの捉えかたにおいては、現在の小・中学校の算数・数学の教科書内容への統計学からの以前と比較しての拡大された範囲の援用は現代社会のデータ分析の手法を身につける基礎として生徒にとって非常に有効と考える。

ただし、上記のことを十分補足すればのことと考えるのであるが…。