無作為抽出したデータから母集団の平均・分散を推定!

前回、無作為抽出とは何なのかを見ていきました。

 

今回は、無作為抽出したデータから

すべてのデータ(母集団)の平均と分散を推定していきましょう。

 

では、循環器科の患者さんの中から、まず10人を選んで

収縮期血圧を記録してみます。

つまり、この10人が標本となり

サンプルサイズは10ということになります。

 

 

平均・分散の項で行ったエクセルの計算要領で

この10名の平均と分散を求めてみましょう。

エクセルで計算した結果

平均:142.2

分散:89.96

標準偏差:9.48

となりました。

 

ここで、無作為に抽出した10個のデータを

標本1とします。

 

そして計算した平均と分散を、それぞれ

標本平均1、標本分散1とします。

 

次にまた母集団から無作為抽出した10個のデータを

標本2、計算した平均と分散を、それぞれ

標本平均2、標本分散2とします。

 

このように繰り返すと、標本がたくさんでき

それぞれに平均と分散を求めることができますね。

 

こうして抽出したたくさんの標本は、データが異なるので

計算値も同じにはなりません。

しかし標本平均たちの平均を求めると

母集団の平均(母平均)に等しくなるのです。

 

一方、標本分散を平均しても、母分散と等しくなりません。

母分散より少し小さな値になります。

 

この標本分散の平均と母分散の差を埋めるために

母分散の推定値として考えられたものを不偏分散といいます。

 

 

この不偏分散が、母分散の推定値となるのです。

タイトルとURLをコピーしました