ASCII倶楽部

このページの本文へ

小島寛明の「規制とテクノロジー」 第162回

総務省統計局の担当者にデータサイエンスの基礎を教わった

2022年01月17日 09時00分更新

文● 小島寛明

  • この記事をはてなブックマークに追加
  • 本文印刷

 新しい年になると、なにか新しいことを始めたくなる。

 運動、定期的な読書、語学の勉強など、すでに何かを始めた人も多いのではないだろうか。

 筆者が興味を持ったのは、総務省統計局の担当者が講義をする「誰でも使えるオープンデータ」という無料のデータサイエンス・オンライン講座だ。

 総務省統計局といえば、国勢調査などさまざまな国の統計を実施している組織だ。

 その組織の担当者が直接、国の統計データの活用法を教えてくれるのであれば、その中身に興味が湧いてくる。

 これまで記事を書くうえで、統計に目を通す機会は少なくなかったが、その取り扱いについて、まとまった知識は持っていない。

 オープンデータを上手に活用できれば、報告書の作成や記事の執筆など、さまざまな場面で役立つかもしれない。

 そう考えて、少し勉強をしてみることにした。

オープンデータを活用し倒す

 まず最初に、「オープンデータ」という言葉からおさらいしておきたい。

 政府が2017年5月に「オープンデータ基本指針」という文書を公表している。

 国や市区町村、企業などが保有するデータを公開し、無償で利用できるものを「オープンデータ」と呼ぶ。

 「誰でも使える統計オープンデータ」の講義の中では、気象情報、図書館の蔵書、税金に関する情報などをオープンデータとして例示している。

 この講座のテーマである「統計オープンデータ」の代表例は、国勢調査だ。

 講座はおもに、政府が公開している統計の総合窓口である「e-Stat」のデータを活用する形で進む。

 最初に取り組むのは、「日本全国にある市の住民の平均所得を調べよう」という基礎的な課題だ。

港区の1人あたり所得は1200万円超

政府統計のポータルサイト「e-Stat」

 筆者は、東京23区も気になったので、23区を加えて調べた。

 e-Statのトップページで、地域の統計データを開き、市と区のデータを表示する。

 「課税対象所得」と「納税義務者数」のデータを、Excelのファイル形式でダウンロードする。

 Excelでデータを開き、各市と23区の課税対象所得を納税義務者数で割ると、1人あたりの所得を計算することができる。

 所得の多い順番に並べ替えると、トップは納税者1人あたりの所得が1200万円を超えている港区だった。

 港区がトップという結果そのものに驚きはないが、1人あたり1200万円を超える結果は突き抜けている。

 千代田区、渋谷区と続き、芦屋市が700万円台で4位に入っている。その後、東京23区が9位まで続き、武蔵野市が10位という結果だった。

カテゴリートップへ

この連載の記事

ASCII倶楽部の新着記事

会員専用動画の紹介も!