「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会

【この記事のキーワード】

2002年以降の抽出率データ改ざん

 つぎに標本誤差率の変動があらわれるのは2002年です。調査全体の誤差率 (図1の青色のライン) は2001年までは0.35%くらいで安定していたのですが、2002年に0.40%、2003年には0.65%へと急激に増加し、およそ1.86倍になっています。なにか調査方法の変更があったとしか思えないのですが、『毎月勤労統計要覧』にはそのような説明はありません。謎です。

 この謎を解くヒントは、1月22日に出た厚生労働省の特別監察委員会の報告書「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」 にありました。15ページに、「規模30人以上499人以下の事業所のうち、抽出されるべきサンプル数の多い地域・産業について、一定の抽出率で指定した調査対象事業所の中から、半分の事業所を調査対象から外すことで、実質的に抽出率を半分に」する方法を2003年までとっていたと書いてあります。毎月勤労統計調査では、事業所規模と産業分類によってこまかい「層」を設定し、その層別にどれくらいの割合で事業所を調査するかの抽出率を決めて、その抽出率にしたがって調査対象事業所を無作為に抽出します。この時に使う「抽出率」の表は、やはり『毎月勤労統計要覧』などに毎年のっています。ところが、こうやって抽出した調査対象事業所のうち一部は実際には調査していなかった、というのです。たとえば、実際に調査した事業所の率は 1/200 だったにもかかわらず、抽出率は 1/100 として報告し、2倍の数の事業所を調査したように見せかけていたわけです。つまり、抽出率表を改ざんしていたことになります。

 このような方法をいつからとりはじめたかは、特別監察委員会報告書には書いてありません。でも、すでにみたように2001年までは誤差率が安定しているので、この方法が始まったのは2002年からだと推測できます。

 ただ、2002年以降の誤差率の変動がこのせいだとすると、別の謎が出てきます。一部の地域・産業について「実質的に抽出率を半分に」しただけにしては、変動が大きすぎるのです。誤差率は調査対象数の平方根に反比例します。対象数を半分に減らしたとしても、そのことによる誤差率の増加は1.41程度のはずです。ところが調査全体の誤差率は、2001-2003年の間で0.35%から0.65%へと1.86倍に増えました。ここから、実質的な抽出率は半分ではなく、もっとたくさんサンプルを捨てていたのではないか、という疑問が出てきます。

 毎年の抽出率と誤差率の表から計算すると、この疑問にも答えることができます。計算方法と結果は 「捨てられていたサンプル: 毎月勤労統計調査2001-2003データの検証」にあるとおりです。

 2003年調査の実質的な抽出率を計算してみたところ、30-99人規模の事業所の全体でみると、本来調査すべきであった事業所のうち、およそ9割で調査していなかったと推測できます。この値は産業によってちがうのですが、いちばんひどいのが「衣服」産業と「卸売・小売業、飲食店」で、いずれも5%程度しか調査していません。当時の事業所統計によると、「卸売・小売業、飲食店」の30-99人規模の事業所は全国に6万程度あったようです。『毎月勤労統計要覧』記載の抽出率表ではここから1/128抽出することになっていたので、約500事業所を調査しないといけなかったはず。しかし、実際に調査したのはわずか20くらいだった、ということを誤差率の数字は示唆しています。

 100-499人規模の事業所では、ここまで状況はひどくないのですが、「衣服」「卸売・小売業、飲食店」のほか「運輸・通信業」でも、『要覧』記載の抽出率は4-5倍の水増しになっていました。 100-499人規模事業所の全体でみると、およそ2倍の水増し率という計算結果です。

 以上の計算は2003年調査についてのもので、この年がいちばん異常な値を示しています。しかしその前の2002年も誤差率は高いですから、このときにはすでに抽出率を改ざんしていたのだろうと思います。そこから調査対象数をもっと減らして、2003年の調査をおこなったのでしょう。

 実は、毎月勤労統計調査では、30-499人の範囲の規模の事業所については、2年から3年に一度の「抽出替え」をおこなって対象事業所を選ぶことになっています (図1で縦の点線が引いてあるところがこの抽出替えの時期です)。いったん対象になった事業所は、2年または3年の間、継続して毎月調査するルールです。今問題にしている21世紀初頭の時期だと、2002年から新しく抽出替えした事業所が対象になり、そのつぎの抽出替えは2004年でした。しかし、上記の誤差率の動きから見ると、実際には2002年と2003年の間でも対象事業所を変えていたと推測できます。このときに、調査対象事業所をいつ入れ替えるかのルールも破っていたということです。

 また、本来の調査対象事業所を抽出したあと、そこからさらに実際に調査する対象を選ぶプロセスがあったはずです。そこが無作為におこなわれていたのかどうかも不安です。特に、2002年に調査した事業所の一部を2003年調査ではずしたのだとすると、2002年の調査結果を見たうえで事業所を選びなおす余地があったということです。そこで恣意的な選択をしていなかったかという疑惑が生じます。

 なお、特別監察委員会報告書は、このように「実質的な抽出率」を操作していたのは2003年までとしています。しかし実際には、2004年にも、30-499人規模の事業所の誤差率は2002年とおなじレベルでした。ですから、この特別監察委員会報告書の説明がまちがい (おそらく聴き取りに応じた担当者の虚偽説明) であって、同様のサンプル間引きは2004年以降も続いていたと考えるべきです。 2007年以降は誤差率の計算方法が変わってしまった (下記参照) ので単純な比較はできないのですが、2017年までの誤差率の推移を見ても、30-499人事業所の誤差率はずっと高いままで、29人以下規模の事業所の誤差率の水準を大きく上回っています。以上のことから、現在の毎月勤労統計調査でも30-499人規模事業所は減らされている、とみるのが合理的です。

1 2 3

「「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会」のページです。などの最新ニュースは現代を思案するWezzy(ウェジー)で。