INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

iMacrosで総務省の境界データをダウンロードを自動化する

estrellita.hatenablog.com

の続き。前回も参考にさせてもらった総務省のデータを Elasticsearch にぶち込んで、緯度経度から市区町村の何丁目までを取り出す - Qiita

1市区町村ずつダウンロードとか正直やってられません。

とあるように約1900ファイルある日本全国分の境界データを手動でダウンロードなどやっていられない。 ブラウザの拡張機能であるiMacrosを使って自動化できたのでメモしとく。 (Seleniumなどでもできるかも)


1. iMacrosのマクロサンプル

以下は千代田区・中央区・港区の境界データをダウンロードするサンプル。


境界データ自動ダウンロードマクロ


各コマンドの意味は次の表の通り。

コマンド 備考
SET !REPLAYSPEED SLOW 自分の環境ではデフォルトだと速すぎてエラーになるのでSLOWに設定
SET !TIMEOUT_STEP 30 境界データのリンクを表示するのに時間がかかる場合があるので30秒を設定
TAG POS=1 TYPE=SELECT ATTR=id:pref_list CONTENT=%13 都道府県コードを指定
TAG POS=1 TYPE=SELECT ATTR=id:city_list CONTENT=%13101 市区町村コードを指定
TAG POS=6 TYPE=A ATTR=TXT:〜* POS=2 : 日本測地系平面直角座標系・Shape形式
POS=3 : 世界測地系平面直角座標系・Shape形式
POS=4 : 世界測地系平面直角座標系・GML形式
POS=5 : 日本測地系緯度経度・Shape形式
POS=6 : 世界測地系緯度経度・Shape形式
POS=7 : 世界測地系緯度経度・GML形式
WAIT SECONDS=3 高負荷をかけないように3秒待機


2. 地域コード一覧

全国の地域コードの一覧もリンク先にアップした。

地域コード一覧 · GitHub


地域コードの重複も結構多い(上記のファイルは重複を除外している)ので自分でリストを作るのであれば注意が必要。


3. ファイルの確認

2016年1月現在、ダウンロードするファイル名の命名規則は以下のようだ。(2015年の国勢調査の結果で変わるかも)

A002005212010[座標系][ファイル形式][測地系]C[地域コード].zip

項目 備考
座標系 XY : 平面直角座標系
DD : 緯度・経度
ファイル形式 S : Shape形式
M : GML形式
測地系 J : 日本測地系
W : 世界測地系


ダウンロード後は必ず希望するファイルがダウンロードできているか確認すること。
(ダウンロードできていない・異なる座標系のファイルをダウンロードしていたことがあったが、やり直すと正常にダウンロードできていた)



次はShapeファイルからGeoJSONに変換する。