本講座では、統計の基本から応用までの知識を身に付けることができる講座になっております。そこで、第11回では、「統計的推定 ①」として、統計学の知識として必要な確率と、確率変数について紹介していきます。(高校数学を履修していること(高校数学レベルの数学が身についていること)が、前提の講座になっています。)
例として、N人の総人口の中からn人の身長データを抽出する場合、N人全員の身長のデータが「有限母集団」である。一方、同一条件で繰り返し、実験・調査・観測が行えると仮定できる場合、ある確率分布からの無作為抽出により、標本が得られ、この確率分布と得られるであろう無限の標本を同一視して「無限母集団」と呼ぶ。
有限母集団では、標本が復元抽出で得られるか非復元抽出で得られるかの違いに注意する必要がある。復元抽出の場合、無作為抽出になるため、無限母集団の場合と一括りに扱えるが、非復元抽出の場合は、別扱いになる。そのため、多くの場合で計算が複雑になる。
ここで、出る確率がp、裏が出る確率1-pの歪んだコインをn回投げる問題、つまり、パラメータpのベルヌーイ分布からのn回無作為抽出を考えてみます。pが未知であり、これを推定したい時、n回中、何回表が出たかが重要になります。(総回数さえ分かれば、何回目に表が出て何回目に裏が出たかは気にしなくて問題ないです。)
十分統計量は一意的でなく、十分統計量に余分な統計量(情報量)が加わったものも、十分統計量である。例として、得られた標本 X 全体も、パラメータ θ の十分統計量である。
上記のように単純なコイン投げでも十分統計量かどうかの判断に計算を要したが、簡単に判定する方法を与えているのが、「フィッシャー-ネイマンの分解定理」である。標本Xの分布は、確率密度関数f(x;θ)を持つとする。
次に、正規分布を例として、十分統計量を計算してみる。
十分統計量の有用性の例として、「ラオ-ブラックウェル推定量」をあげます。
データの特徴を見るとき、ヒストグラムや散布図がよく用いられる。これらは、データの順番を変えても同じ図が得られる事から、データの順番を落とすという意味で、順序統計量と同じ考え方に基づいていると言えます。
◆出題用語(本講座で出題された用語をまとめます。下記用語の意味がわからない場合は本講座を復習してみてください。)
- 母集団
- 標本
- 有限母集団
- 無限母集団
- 統計的推定
- 推定理論
- 区間推定
- 点推定
- 推定値
- 推定量
- 十分統計量
- フィッシャー-ネイマンの分解定理
- ラオ-ブラックウェル推定量
- ラオ-ブラックウェルの定理
- 順序統計量
- 中央値(メディアン)
- 四分位数
コメント
コメント一覧 (1件)
[…] 第11回 「母集団・標本」〜 統計的推定 ① 〜 […]