自治体別の集計でハマったこと

仕事で自治体別にデータを集計してほしいと頼まれたときの失敗談です。

ある仕事で自治体別に数量を集計したのですが、条件として区・市と郡別に集計する、つまり町と村は郡単位で集計するものでした。

ここで最終チェックを行ったら計算が合わない。どこかに二重計上されているようです。探していると…ありました。熊毛郡

原因はわかっていました。区市町村単位であれば、同一自治体があることは分かっていたので注意していたのですが、日本に同一名称の郡はないだろうと勝手に判断していました。ところが郡にも同一名称のものが存在するためです。

一番良い方法はコードを使って集計すればこういった失敗は起こらないのですが、データに文字データしか存在しないときに起こってしまいます。そういったときは都道府県名+市区町村名(または郡名など)として集計するのがベストでしょう。

一方で、ひとのせいにしてしまうのも悪いのですが、行政のコード体制も微妙と感じるのは私だけでしょうか。

総務省のデータは区のデータは東京のみですし、郡のデータはありません。JISはどこからダウンロードすればよいのだろうか…と思います。結局のところ、個人で綺麗にまとめているようなサイトからダウンロードすることも多々あります。

どーにか良い方法はありませんかね・・・。

ついでに熊毛郡は山口県と鹿児島県にあります。そのほかWikipediaに「同一名称の市区町村一覧」に大量(!)に掲載されていますので興味のある方は参考に。

シェアする

コメントを残す

メールアドレスが公開されることはありません。

コメントする