サンプル数は十分か?

Expired
 結果そのものには大して興味は無いのだけど、調査の仕方にふと疑問が浮かんだ。

 分析によると、理系出身者の平均年収は約681万円で、文系出身者の約583万円よりも約100万円高かった。このほか、サンプルをもとに40歳時のモデル年収を推計したところ、理系男性が約717万円、文系男性が約680万円だった一方、理系女性が約498万円、文系女性が約402万円と男性の方が約220〜280万円も高く、男女間の賃金格差が浮き彫りとなった。

 研究チームは平成20年6月、民間のリサーチ会社に依頼し、インターネット上で職業や年収、出身学部などのアンケートを実施。有効回答の中から大卒以上の就業者1632人のサンプルを分析した。理系988人、文系644人で、男女比は男性71%、女性29%。平均年齢は43歳だった。

 この1600人というサンプル数は日本全体を論じるのに十分なのだろうか?少なすぎない?

 ということでさらっとググってみた。(内容は理解してない)

 N's spirit 統計の基礎的手法 スタージェスの公式 大数の法則 によると、1000万人の母集団を95%の信頼度で調べるのに必要なサンプル数は1067になるらしい。(なんらかの前提条件が必要な式なのかどうかはよく分からんけど)
 母集団が1億人の場合について同様に計算してもやはり1067そこそこになる。と言うことは、この調査の1600人というサンプル数は日本の労働人口に対して95%以上の信頼度をもつということになる。

 ちなみに今年予備調査が行われた国際成人力調査(PIAAC)も調査人数は5000人(予備調査は1400人)。5000人と言えば1億人の0.005%に過ぎない。こんなサンプル数で国全体の統計として意味あるのだろうか?と疑問に思っていたけど、上記のように1600人でもそれなりの信頼度があるのだとすれば5000人は十分なサンプル数なのだろう。