欠損データ

Missing Data (Quantitative Applications in the Social Sciences)

Missing Data (Quantitative Applications in the Social Sciences)

 アンケート調査における欠損データ(わからない、無回答)にどう対処したらよいのかについて、わかりやすく書かれた解説書。

 欠損データには「完全にランダムな欠損」(Missing Completely at Random)と「ランダムな欠損」(Missing at Random)、そして「無視できない欠損」がある。最後の「無視できない欠損」をいい加減に扱うと、パラメータの推定にゆがみが生じる。

 たとえば、英語のジャーナルを読んでいると、欠損データを平均値で置き換えて、置き換えをおこなったかどうかを示すダミー変数を投入する、という手続きをよく見かけるが、この方法で欠損データを処理すると、パラメータ推定値は「真」の値から大きくはずれたものになってしまう。

 欠損データを埋める効果的な方法として、マルティプル・インピュテーションとEMアルゴリズムを用いた方法が紹介されている。

 理論的には理解できるものの、いざ実践するとなると、ハードルがもう一段高くなるという印象を受けた。とりわけ「簡便な」方法ではなく、「効果的」だとされる方法にかんしては、SPSSを使って遂行するのは難しいようだ。大学のコンピュータに入っているソフトでできそうなのはSASとAmosか。