欠損データ
Missing Data (Quantitative Applications in the Social Sciences)
- 作者: Paul D. Allison
- 出版社/メーカー: SAGE Publications, Inc
- 発売日: 2001/10/03
- メディア: ペーパーバック
- クリック: 21回
- この商品を含むブログ (4件) を見る
アンケート調査における欠損データ(わからない、無回答)にどう対処したらよいのかについて、わかりやすく書かれた解説書。
欠損データには「完全にランダムな欠損」(Missing Completely at Random)と「ランダムな欠損」(Missing at Random)、そして「無視できない欠損」がある。最後の「無視できない欠損」をいい加減に扱うと、パラメータの推定にゆがみが生じる。
たとえば、英語のジャーナルを読んでいると、欠損データを平均値で置き換えて、置き換えをおこなったかどうかを示すダミー変数を投入する、という手続きをよく見かけるが、この方法で欠損データを処理すると、パラメータ推定値は「真」の値から大きくはずれたものになってしまう。
欠損データを埋める効果的な方法として、マルティプル・インピュテーションとEMアルゴリズムを用いた方法が紹介されている。
理論的には理解できるものの、いざ実践するとなると、ハードルがもう一段高くなるという印象を受けた。とりわけ「簡便な」方法ではなく、「効果的」だとされる方法にかんしては、SPSSを使って遂行するのは難しいようだ。大学のコンピュータに入っているソフトでできそうなのはSASとAmosか。