ばらつきを数値化するために理解したい!【分散・標準偏差】とは

【統計を1から簡単に!】シリーズ

前回は度数分布図を作って、ばらつきを可視化しました。

 

今回はエクセルでの計算の前に

ばらつきについて考え、分散と標準偏差とは何かを理解していきましょう。

 

 

 

分散


では、前回(度数分布)のクラスAとクラスBの

度数分布図を確認してみましょう。

 

 

 

 

 

クラスAは65~100点と幅広く分布しています。

つまり、ばらつきが大きいということですね。

 

一方クラスBは75~90点と狭い範囲に分布しています。

つまりばらつきが小さいということですね。

 

 

クラスAとクラスBの点数を、点数順に並べてみると

平均からの差が大きいか、小さいかが分かりやすくなります。

 

クラスAはばらつきは大きいので、平均からのズレが大きくなりますね。

 

 

一方、クラスBはばらつきが小さいので、平均からのズレが小さくなりますね。

 

図の赤矢印のズレの部分をすべて足したものが

ばらつきの数値にそうですね。

 

ただ、平均のラインから下、つまりマイナスの数値も入っているので

2乗の総和にする必要がありそうですね。

最後にデータ数で割ったもの、これが分散です。

 

 

 

 

標準偏差


先ほどの分散の式を見てみると

式の中で2乗しているので、分散の数値の平方根(√)をとる必要があります。

 

つまり、標準偏差の式は

標準偏差=√分散

 

となるのです。

 

今回の内容はちょっと複雑に感じたかもしれませんね。

実際の研究においては、膨大なデータに対してこうした計算をするには

時間が掛かりすぎますので、ソフトやエクセルを活用して計算していきます。

 

次回は分散や標準偏差を、エクセルと使って計算する手順を見ていきましょう。

タイトルとURLをコピーしました