社会

「毎月勤労統計調査」は90年代以前から改ざんされていた? データ改ざんに甘い社会

【この記事のキーワード】

2004年以降の誤差率データ改ざん

さて、毎月勤労統計調査をめぐる一連の不正のうち、昨年末にまず発覚したのが、東京都の500人以上規模の事業所は抽出率が1 (つまり全数調査) と報告されているにもかかわらず、実態はそうではなかったという問題でした。この不正抽出は、2004年からはじまりました 。毎月勤労統計調査は、これ以降、抽出率を改ざんして報告してきたことになります。それにとどまらず、誤差率表も、実はこれ以降改ざんされています。

 『毎月勤労統計要覧』の誤差率表には、500人以上規模事業所の欄がありません。そのかわり、「規模500人以上は全数調査である」という注釈がついています。これはつまり、規模500人以上については誤差率はすべてゼロであるので、記載を省略する、という意味です。

 確かに、調査対象を選出しない全数調査であれば、標本誤差はゼロになります。全ての事業所を調査するのですから、そこで得られた給与の平均値などがそのまま全事業所の平均値とみなせるのです。もちろん、事業所がまちがった数値を回答するなどの問題はあるのですが、それは事業所をサンプリングしたことによる誤差とは別物なので、「誤差率」の計算にはカウントしません。

 しかし、2004年以降は全数調査ではなくなったのですから、標本誤差は発生していたはずです。本来なら、500人以上規模についても、誤差率の表にその欄を設けていちいち誤差率を書かなければならなかったのです。

 それだけではなく、調査全体の誤差率も改ざんされています。これは、500人以上規模の事業所は全数調査なので誤差はゼロ、ということを前提にして誤差を総計しているからです。本当は500人以上規模の事業所についても誤差を足し上げていかなければならないところ、そこをすべてゼロだとみなして合計を求めていたわけです。当然、調査全体について総計して算出される誤差率は、実態よりも小さい値になります。

 さらに、2007年には、誤差率の計算方法が変更されました。平均給与の高い層の誤差率をより大きく重みづけて調査全体の誤差率を計算する方法です (それまでの計算方法による数値を「標本誤差率」と呼んできたのに対して、これ以降は「標準誤差率」ということばを使っています)。大規模な事業所には、給与が高いところが多いでしょう。500人以上規模の事業所は誤差ゼロとなっていることがより大きく重みづけされ、全体の誤差率を引き下げることになります。図1で調査全体の誤差率が2007年から突然縮小するのは、このせいだと解釈できます。

 図1右端の2017年の誤差率は、今年1月17日に厚生労働省から出た資料「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて(追加資料)」 からとっています。これは東京都の500人以上規模の事業所が抽出調査になっていたことを前提にして計算しなおした資料です。この2017年調査の全体の誤差率は0.35%でした。それ以前 (0.17%程度) にくらべて約2倍になっています。逆にいうと、2016年までの誤差率表は、調査全体の誤差を約半分に見せかけるよう改ざんしたものでした。これは、500人以上規模の事業所の標本誤差をゼロとみなして誤差を計算してきた結果なのです。

データ改ざんに甘い社会

 以上みてきたように、毎月勤労統計調査に関しては、つぎの3つの問題を指摘できます。

・1990年代以前から、調査対象事業所数を実際よりも多く報告してきた
・2002年以降、抽出率を実際よりも高く報告してきた
・2004年以降、500人以上規模事業所の標本誤差をゼロとみなすことにより、誤差率を実際よりも低く報告してきた 

 これらはいずれも、調査の精度を実際よりも高く見せていたということです。毎月勤労統計調査は、この四半世紀以上の間、改ざんした数値を使って調査の精度を偽装し、実態よりも価値の高い調査であるかのように見せかけてきたのです。

 問題が発覚した後、厚生労働省の特別監察委員会が調査をおこないました。その結果が1月22日に報告されたのですが、その内容は耳を疑うものでした。監察委員会は、上記のような問題を基本的には事実として認めながら、それらは「改ざん」ではないと結論付けたのです (27ページ)。つまり、調査対象の数を実際より大きく見せかけることも、標本誤差を実際よりも小さく見せかけることも、改ざんではないというのです。この委員会には経済学者などの学識経験者も入っていました。そういうメンバーのいる委員会から、調査の規模を過大に報告したり誤差が過小に出るように数値を加工したりするのは「改ざん」にあたらない、との見解が出てきたのは衝撃的です。

 調査対象の数や推定値の誤差率といった数値は、調査の精度を知るための基礎的な指標です。こうした数値を改ざんしてもかまわないという意識が政府にも学術界にも蔓延しているとしたら、今回の不祥事は起こるべくして起こったことといえます。そしてまた、毎月勤労統計調査にかぎらず、政府統計や科学研究の成果とされる知見の多くはデータ改ざんの結果導き出された恣意的なものではないのかという疑いを、私たちは持たざるをえないのです。

1 2 3

「いいね!」「フォロー」をクリックすると、SNSのタイムラインで最新記事が確認できます。