Machinakaの日記

新作映画の情報・批評を、裏ネタ満載で包み隠さずお届け




東京都における勤労統計の虚偽記載問題ー全数調査と標本調査を押さえよう!

 
こんにちは! 
 
Machinakaです!!
 
Twitterもやってます!
 
 
 
 
 
 
 目次
 

ニュースで聞き覚えのある専門用語が

 
 
はい、今回は映画記事じゃございません。
 
トレンドブログ? そう言われれば、そうかもしれない。
 
今回は東京都における勤労統計の虚偽記載問題について、語りたいと思います。
 
東京都が調査し、政府(総務省)に提供している勤労統計において、500人以上の事業所の調査においては「全数調査をする」という記載があったにもかかわらず、実質的には標本調査としていた。そして、実際には1/3の事業所しか調査していなかった(票が集まらなかった)という問題である。
 

 

 
日頃このブログを見てる人には、なぜこんなの書くんだよ
 
 
という疑問が渦巻いていることだろう。というか、見てすらいないかもしれないので、あまりウケを狙うことなく書いていきたい。
 
いや、本来ならこんなの書きたくないんですけど、ツイッターでは精度がどうのこうのだ、あれこれ言ってる人がいて、黙ってはいられなかったのです。
 
 
 
 
 
 

全数調査と標本調査の違い

全数調査とは、調査する対象の全てを調査することであり、他の統計であれば「国勢調査」が採用している手法である。
 
今回は標本調査としていたことが問題になったが、ほとんどの調査は全数調査などやっていない。
 
なぜなら、全ての事業所を調査するなど不可能に近いから。
 
調査票に記入してくれなかった事業所に催促したり、直接足を運ぶだけでも膨大なお金がかかる。
 
そもそも、この調査をどれだけやっても企業には一銭もお金が入ってこない。そもそも、全数調査は無理難題なのだ。
 
 
 
そこで出てきたのが統計学による標本調査。
 
全体を「母集団」、全体の中から一部を抽出したものを「標本」あるいは「サンプル」と呼び、標本の中だけで調査を行い、母集団で調査した結果を推定するものだ。
 
肝心の標本数は、以下で決定される。
 
例えば、日本においてブログをやっている人の割合を調べたいとする。
 
この場合、標本数は以下で決定される。
 

f:id:Machinaka:20190117181957p:plain

Nは母集団の大きさ、nは標本に含まれる調査対象数、pはブログをやってる人の割合
 
 

 

 

得られた標本数と調査結果を元に、推計を行う。

 

以下の式はテキトーに拾ってきたものだが、概ね推計方法はこんな感じ。

 

変数が多くて分かりづらいが、実はすごく簡単。

 

 

f:id:Machinaka:20190117190324g:plain

 

www.maff.go.jp

 

 

 

例えば、日本で年間どれだけ映画が鑑賞されているか、日本の年間総鑑賞本数を調べたいとする。

 

日本に住む人は約1億2000万人。これが母集団の数。

 

これを全て調査するわけにはいかないので、標本数を1000人に絞って調査したとする。

 

そこで、1000人が見た映画の鑑賞本数を計上し、1000人で割る。これで、一人当たりの鑑賞本数が分かる。

 

 

1000人の総鑑賞本数/1000人=一人当たりの鑑賞本数

 

これを、日本の人口1億2000万人で掛けてあげる。これで日本の総鑑賞本数を推計する。

 

日本の年間総鑑賞本数=1000人の総鑑賞本数/1000人*1億2000万人

 

厳密には様々な係数をかけており補正をしているが、簡単にいえば推計方法はこんな感じ。

 

 
 
 
  

虚偽記載はダメだけど、東京都は標本調査で全然OKだよ

 

 

東京都の統計年鑑における事業所数を見てみる。

 

今回の問題と同じ500人以上の事業所を見つけることは出来なかったが、300人以上の事業所数だけでも3283ある。

  

f:id:Machinaka:20190117183944p:plain

 

www.toukei.metro.tokyo.jp

 

 

500人以上の事業所はより少なくなるが、十分多い数字だろう。

 

全事業所に対して調査をするなんて、どう考えてもおかしい。無理がある。

 

標本は十分すぎるほどあるのだ。わざわざ全数調査する必要がない。

 

ちなみに、全数調査を採用している国勢調査では、「日本で暮らしている人」を対象にするため、病院の入院患者や刑務所にいる人まで聞いているらしい。

 

 

虚偽記載は確かに問題だ。でも、標本調査自体が悪いわけじゃない。

 

特に東京都で500人以上働いている事業所なんて、ごまんといる。1/3しか集められなくたって、十分すぎるほどある。

 

例えば、全体が9事業所しかなく3事業所しか聞いてなかったら問題であろう。

しかし、900事業所のうち300事業所聞いていれば、統計調査においては十分すぎるほどの信頼性がある。

 

「精度が!」「精度が!!」と喚いている人は、今一度考え直して欲しい。

 

www.toukei.metro.tokyo.jp

 

 

 
 
 
 
 
© 2015,machinaka.hatenablog.com