自治体別の集計でハマったこと
仕事で自治体別にデータを集計してほしいと頼まれたときの失敗談です。
ある仕事で自治体別に数量を集計したのですが、条件として区・市と郡別に集計する、つまり町と村は郡単位で集計するものでした。
ここで最終チェックを行ったら計算が合わない。どこかに二重計上されているようです。探していると…ありました。熊毛郡。
原因はわかっていました。区市町村単位であれば、同一自治体があることは分かっていたので注意していたのですが、日本に同一名称の郡はないだろうと勝手に判断していました。ところが郡にも同一名称のものが存在するためです。
一番良い方法はコードを使って集計すればこういった失敗は起こらないのですが、データに文字データしか存在しないときに起こってしまいます。そういったときは都道府県名+市区町村名(または郡名など)として集計するのがベストでしょう。
一方で、ひとのせいにしてしまうのも悪いのですが、行政のコード体制も微妙と感じるのは私だけでしょうか。
総務省のデータは区のデータは東京のみですし、郡のデータはありません。JISはどこからダウンロードすればよいのだろうか…と思います。結局のところ、個人で綺麗にまとめているようなサイトからダウンロードすることも多々あります。
どーにか良い方法はありませんかね・・・。
ついでに熊毛郡は山口県と鹿児島県にあります。そのほかWikipediaに「同一名称の市区町村一覧」に大量(!)に掲載されていますので興味のある方は参考に。