新しい年になると、なにか新しいことを始めたくなる。
運動、定期的な読書、語学の勉強など、すでに何かを始めた人も多いのではないだろうか。
筆者が興味を持ったのは、総務省統計局の担当者が講義をする「誰でも使えるオープンデータ」という無料のデータサイエンス・オンライン講座だ。
総務省統計局といえば、国勢調査などさまざまな国の統計を実施している組織だ。
その組織の担当者が直接、国の統計データの活用法を教えてくれるのであれば、その中身に興味が湧いてくる。
これまで記事を書くうえで、統計に目を通す機会は少なくなかったが、その取り扱いについて、まとまった知識は持っていない。
オープンデータを上手に活用できれば、報告書の作成や記事の執筆など、さまざまな場面で役立つかもしれない。
そう考えて、少し勉強をしてみることにした。
オープンデータを活用し倒す
まず最初に、「オープンデータ」という言葉からおさらいしておきたい。
政府が2017年5月に「オープンデータ基本指針」という文書を公表している。
国や市区町村、企業などが保有するデータを公開し、無償で利用できるものを「オープンデータ」と呼ぶ。
「誰でも使える統計オープンデータ」の講義の中では、気象情報、図書館の蔵書、税金に関する情報などをオープンデータとして例示している。
この講座のテーマである「統計オープンデータ」の代表例は、国勢調査だ。
講座はおもに、政府が公開している統計の総合窓口である「e-Stat」のデータを活用する形で進む。
最初に取り組むのは、「日本全国にある市の住民の平均所得を調べよう」という基礎的な課題だ。
港区の1人あたり所得は1200万円超
筆者は、東京23区も気になったので、23区を加えて調べた。
e-Statのトップページで、地域の統計データを開き、市と区のデータを表示する。
「課税対象所得」と「納税義務者数」のデータを、Excelのファイル形式でダウンロードする。
Excelでデータを開き、各市と23区の課税対象所得を納税義務者数で割ると、1人あたりの所得を計算することができる。
所得の多い順番に並べ替えると、トップは納税者1人あたりの所得が1200万円を超えている港区だった。
港区がトップという結果そのものに驚きはないが、1人あたり1200万円を超える結果は突き抜けている。
千代田区、渋谷区と続き、芦屋市が700万円台で4位に入っている。その後、東京23区が9位まで続き、武蔵野市が10位という結果だった。
この連載の記事
- 第314回 SNSの“ウソ”選挙結果に影響か 公選法改正議論が本格化へ
- 第313回 アマゾンに公取委が“ガサ入れ” 調査の進め方に大きな変化
- 第312回 豪州で16歳未満のSNS禁止 ザル法かもしれないが…
- 第311回 政府、次世代電池に1778億円 「全固体」実現性には疑問も
- 第310回 先端半導体、政府がさらに10兆円。大博打の勝算は
- 第309回 トランプ2.0で、AIブームに拍車?
- 第308回 自動運転:トヨタとNTTが本格協業、日本はゆっくりした動き
- 第307回 総選挙で“ベンチャー政党”が躍進 ネット戦略奏功
- 第306回 IT大手の原発投資相次ぐ AIで電力需要が爆増
- 第305回 AndroidでMicrosoftストアが使えるように? “グーグル分割”の現実味
- この連載の一覧へ