このサイトについて

このサイトは何?

本サイトは、「BAD オープンデータ供養寺」プロジェクトの一環として、総務省が発行している「マイナンバーカード交付状況について」から自動的にデータを抜き出し、CSV として保存しています。

本サイトで提供されているデータについては自由に使っていただいてかまいませんが、総務省のウェブサイトには、データについてのライセンスが記載されていませんので、自己責任の上お使いください。

BAD オープンデータ供養寺って何?

BAD オープンデータ供養寺とは、Code for Japan Summit の人気コンテンツの一つで、データとして活用するために適切な形式になっていないオープンデータ(BAD オープンデータ)が二度とこの世を彷徨わないように、「供養(データクレンジング)」する方法を考える場です。

データの公開に携わる行政職員の方や、データを利活用するエンジニア・データサイエンティスト等の皆さまと、より使いやすく品質の高いオープンデータの公開と加工の仕組みを考えていくために建立されました。

Code for Japan Summit 2019 でのセッションが動画で公開されています。

何ができるの?

マイナンバーの普及率を確認する

トップページでは、CSV データを Tableau でビジュアライゼーションしたデータを閲覧することができます。 データは 1 日 1 回のペースで深夜に更新されます。(総務省の PDF は今の所月 1 回のペースで更新されているようです。)

CSV データを入手する

データ一覧から、CSV ファイルをダウンロードすることができます。総務省の PDF ファイルが公開されている日付のフォルダの下に、以下のファイルが存在しています。データ形式の詳細についてはデータ形式についてをご確認ください。

ファイル名 解説
summary_by_types.csv 団体区分別
demographics.csv 男女・年齢別(2017 年 3 月 8 日分には存在しません)
all_prefectures.csv 都道府県一覧
all_localgovs.csv 市区町村一覧

Google Spreadsheet で見る

Google Spreadsheetに、CSV ファイルの内容がインポートされています。 各ファイル名のファイルの中に、年月日ごとのタブが存在しています。

どんな処理をしているの?

マイナンバーカードの交付状況のような情報は、データの性格的には PDF ではなく CSV 等の形式で提供すべきものですが、PDF で公開されています。それをデータ化するために様々な処理を行っています。詳細についてはデータ供養の方法をご確認ください。 本来、PDF ではなく CSV 形式でデータを提供していれば、数多くの処理は必要ありません。行政関係者は、ぜひ総務省の担当部署に本サイトの存在をお伝えいただければと思います。

ソースコードについて

PDF→CSV の変換スクリプトや本ウェブページのソースコードについては、mynumbercard_statistics on GitHubで公開されています。 ご要望やご質問等、ご提案等ございましたら、Issues よりご自由にご登録ください。 MIT ライセンスで提供されており、ご自身のためにカスタマイズしてご利用いただくことも可能です。

Google Spreadsheet から CSV を取り込む処理についても、gspreadsheet-importer on GitHubにて公開されています。 Google Spreadsheet から インターネット上にある CSV ファイルを自動的に取得できるスクリプトですので、ご自由に利用ください。

開発者について

Code for Japan が開発、メンテナンスしています。