アスキーの会員サービスASCII倶楽部では、会員の方だけが読めるさまざまな連載や特集が毎日更新中。
本日は、ASCII倶楽部の人気記事「総務省統計局の担当者にデータサイエンスの基礎を教わった」を紹介します。
新しい年になると、なにか新しいことを始めたくなる。
運動、定期的な読書、語学の勉強など、すでに何かを始めた人も多いのではないだろうか。
筆者が興味を持ったのは、総務省統計局の担当者が講義をする「誰でも使えるオープンデータ」という無料のデータサイエンス・オンライン講座だ。
総務省統計局といえば、国勢調査などさまざまな国の統計を実施している組織だ。
その組織の担当者が直接、国の統計データの活用法を教えてくれるのであれば、その中身に興味が湧いてくる。
これまで記事を書くうえで、統計に目を通す機会は少なくなかったが、その取り扱いについて、まとまった知識は持っていない。
オープンデータを上手に活用できれば、報告書の作成や記事の執筆など、さまざまな場面で役立つかもしれない。
そう考えて、少し勉強をしてみることにした。
オープンデータを活用し倒す
まず最初に、「オープンデータ」という言葉からおさらいしておきたい。
政府が2017年5月に「オープンデータ基本指針」という文書を公表している。
国や市区町村、企業などが保有するデータを公開し、無償で利用できるものを「オープンデータ」と呼ぶ。
「誰でも使える統計オープンデータ」の講義の中では、気象情報、図書館の蔵書、税金に関する情報などをオープンデータとして例示している。
この講座のテーマである「統計オープンデータ」の代表例は、国勢調査だ。
講座はおもに、政府が公開している統計の総合窓口である「e-Stat」のデータを活用する形で進む。
最初に取り組むのは、「日本全国にある市の住民の平均所得を調べよう」という基礎的な課題だ。
港区の1人あたり所得は1200万円超
筆者は、東京23区も気になったので、23区を加えて調べた。
e-Statのトップページで、地域の統計データを開き、市と区のデータを表示する。
「課税対象所得」と「納税義務者数」のデータを、Excelのファイル形式でダウンロードする。
Excelでデータを開き、各市と23区の課税対象所得を納税義務者数で割ると、1人あたりの所得を計算することができる。
所得の多い順番に並べ替えると、トップは納税者1人あたりの所得が1200万円を超えている港区だった。
港区がトップという結果そのものに驚きはないが、1人あたり1200万円を超える結果は突き抜けている。
千代田区、渋谷区と続き、芦屋市が700万円台で4位に入っている。その後、東京23区が9位まで続き、武蔵野市が10位という結果だった。
続きは「総務省統計局の担当者にデータサイエンスの基礎を教わった」でお楽しみください。
なお、こちらの記事の続きを読めるのはASCII倶楽部会員の方限定です。
ASCII倶楽部には、今回紹介した記事だけでなく、PCやスマホ、カメラ、テレビ、オーディオなどの会員だけが読める連載が更新されております! さらに、週刊アスキー 電子版の最新号から過去4年ぶん以上のバックナンバーが読み放題となっております。
会員制読み放題サービス
ASCII倶楽部(アスキークラブ)
■利用料金
月額 税込1080円
※毎月1日~末日までの利用料金として
■支払方法等
●クレジットカード
* VISAカード/MasterCard/アメリカン・エキスプレスカード/JCBカード
●auかんたん決済
●ドコモケータイ払い
●Amazon アカウント
※auかんたん決済、ドコモケータイ払いを選択された方は、3日間無料キャンペーンをご利用いただけません。 ※ご利用になる決済機関によって決済時期及び決済方法が異なります。
それぞれの決済機関が定める利用規約等をご確認ください。
■提供時期
月額利用料金の支払い後、すぐに利用可能。
■推奨環境 <端末・ブラウザ>
【PC】
・OS
Windows 7 以上 , Mac OS X 10.10以上
・ブラウザ
(Windows)Internet Explorer 11※Edgeは除く , Google Chrome最新版 , Firefox最新版
(Mac)Safari最新版
【スマートフォン】
・OS
iOS 8 以上 , Android 4.x以上
・ブラウザ
(iOS)Safari
(Android)Google Chrome
URL ASCII倶楽部