社会

「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会

【この記事のキーワード】
「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会の画像1

Thinkstock/Photo by marchmeena29

 厚生労働省「毎月勤労統計調査」をめぐって、この1か月の間にさまざまな報道がなされています。特に注目を集めているのは、東京都の大規模事業所を一部抽出していたのにその統計処理を怠ったため、平均給与が低めに推計されていた問題です。一方で、この事件の別の側面として、対象事業所数や誤差率など、調査精度をあらわす数値の偽装という問題があります。この観点からみたときに何が見えてくるのか、これまでにわかっている情報から整理してみました。

1990年代以前からの調査対象削減

 まず、いちばんわかりやすい問題として、調査対象の数を勝手に減らしていたことがあります。 1月17日に厚生労働省が提出した資料「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて (追加資料)」によれば、2004年以降、毎月勤労統計調査で対象としていた事業所の数は表1のようになっていました。

「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会の画像2

表1: 毎月勤労統計調査の調査対象事業所数とその公表値 (2004-2018年)
厚生労働省政策統括官 (統計・情報政策、政策評価担当)「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて (追加資料)」(2019年1月17日 統計委員会資料2-2) p. 4.

 これまで毎月勤労統計調査の報告書などにのっていた調査対象数の説明は、第一種事業所 (30人以上の常用労働者がいる事業所) が約1万6700、第二種事業所 (常用労働者が5-29人の事業所) が約1万6500 (=合計で3万3200事業所) というものでした。つまり、本当は2万8271事業所しか調査していないにもかかわらず、3万3200事業所を調査しました、と水増しして報告していたわけです。数値を改変して事実と異なる報告をする、このような行為のことを「改ざん」といいます。

いまのところ、本当にいくつの事業所を対象として調査したのかという数字は、2004年以降しか出てきていません。それ以前については、「確認できた範囲では、平成8年以降、調査対象事業所数が公表資料よりも概ね1割程度少なくなっていた」(厚生労働省「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて」2019年1月17日統計委員会資料2-1) とされているだけです。これは単に平成7年 (1995年) 以前については確認できていないというだけの話ですから、いつからデータ改ざんをおこなってきたかはわからないことになります。

では情報が全然ないかというと、そうでもありません。従来から報告されてきた資料のなかに、「誤差率」という数値があります。この数値は、調査結果をもとに推計する平均給与などの数字を見るときに、どの程度の「標本誤差」を見込んで解釈すればよいかの目安をあたえるものです。こうした調査では、一部の対象を選出して調査を行うため、必ず誤差が生じてしまいます。こうした誤差を「標本誤差」と言います。毎月勤労統計では、事業所数が半分になると誤差率が√2倍になるというように、事業所数と一定の関係を持った数値が計算されています (計算方法を説明した『毎月勤労統計要覧』のコピーが https://remcat.hatenadiary.jp/entry/20190123/1548237122 にあります)。

 むかしは報告どおり3万3200事業所をきちんと調査していたのに、ある時期から2万8000くらいに減らしたのだとすると、誤差率がその時期に1.07倍くらいになっているはずです。数字を追っていくと、その時期が特定できるかもしれません。そこで、『毎月勤労統計要覧』の各年版から誤差率の数値をひろってきました。

「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会の画像3

図1: 毎月勤労統計調査における誤差率の推移 (1990-2017年)

「きまって支給する給与」についての値。厚生労働省/労働省『毎月勤労統計要覧』各年版。ただし2017年のみ厚生労働省「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて (追加資料)」(2019年1月17日 統計委員会資料2-2 p. 4)。
『毎月勤労統計要覧』平成20年版289頁の「平成20年7月分」の表は「平成19年」データとして扱った。
2006年までは「標本誤差率」、2007年以降は「標準誤差率」。計算方法がちがうので注意 (本文参照)。
1990年のみ3月分の値。ほかは7月分。
1991-1993年の値は『毎月勤労統計要覧』に記載なし。2016年は5-29人規模事業場の結果がローテーション組別の表記となっていて、全体の誤差率が不明。
縦の点線は、30-499人規模事業場の「抽出替え」の時期を示す。

 図1をご覧いただければ分かる通り、1996年前後には、誤差率の目立った変化はありません。その前に目を移すと、1990年から1994年の間に、30-99人規模の事業所で誤差率があがっています。ここでこの規模の事業所の調査対象数を減らした、ということはありそうです。ただ、おなじ時期に29人以下規模事業所の誤差率は逆にさがっています。 1990年には29人以下規模事業所の誤差率がほかより少し高めになっていたので、そこの数を増やし、ほかの事業所の数を減らしてつじつまをあわせた、というようなことはあったのかもしれません。ただ、調査全体の誤差率は0.35%くらいで、この値は1990-2001年の間、ほとんど一定です。調査全体の対象事業所数はほとんど変わっていなかったと考えたほうがよさそうです。

 残念ながら、1989年以前は、調査結果の報告の形式がちがっていて、調査全体の誤差率は公表されていません。事業所規模別の誤差率も『毎月勤労統計要覧』にのっていない年が多く、1980年代以前のデータを調べる作業はこれからの課題です。ただ、ここまでの情報を総合すると、調査対象事業所数データの改ざんは、1990年代前半にはもうおこなわれていたのであり、その開始時点は1980年代かそれ以前にさかのぼると推測できます。

1 2 3

「いいね!」「フォロー」をクリックすると、SNSのタイムラインで最新記事が確認できます。