iMacrosで総務省の境界データをダウンロードを自動化する
の続き。前回も参考にさせてもらった総務省のデータを Elasticsearch にぶち込んで、緯度経度から市区町村の何丁目までを取り出す - Qiitaに
1市区町村ずつダウンロードとか正直やってられません。
とあるように約1900ファイルある日本全国分の境界データを手動でダウンロードなどやっていられない。 ブラウザの拡張機能であるiMacrosを使って自動化できたのでメモしとく。 (Seleniumなどでもできるかも)
1. iMacrosのマクロサンプル
以下は千代田区・中央区・港区の境界データをダウンロードするサンプル。
各コマンドの意味は次の表の通り。
コマンド | 備考 |
---|---|
SET !REPLAYSPEED SLOW | 自分の環境ではデフォルトだと速すぎてエラーになるのでSLOWに設定 |
SET !TIMEOUT_STEP 30 | 境界データのリンクを表示するのに時間がかかる場合があるので30秒を設定 |
TAG POS=1 TYPE=SELECT ATTR=id:pref_list CONTENT=%13 | 都道府県コードを指定 |
TAG POS=1 TYPE=SELECT ATTR=id:city_list CONTENT=%13101 | 市区町村コードを指定 |
TAG POS=6 TYPE=A ATTR=TXT:〜* | POS=2 : 日本測地系平面直角座標系・Shape形式 POS=3 : 世界測地系平面直角座標系・Shape形式 POS=4 : 世界測地系平面直角座標系・GML形式 POS=5 : 日本測地系緯度経度・Shape形式 POS=6 : 世界測地系緯度経度・Shape形式 POS=7 : 世界測地系緯度経度・GML形式 |
WAIT SECONDS=3 | 高負荷をかけないように3秒待機 |
2. 地域コード一覧
全国の地域コードの一覧もリンク先にアップした。
地域コードの重複も結構多い(上記のファイルは重複を除外している)ので自分でリストを作るのであれば注意が必要。
3. ファイルの確認
2016年1月現在、ダウンロードするファイル名の命名規則は以下のようだ。(2015年の国勢調査の結果で変わるかも)
A002005212010[座標系][ファイル形式][測地系]C[地域コード].zip
項目 | 備考 |
---|---|
座標系 | XY : 平面直角座標系 DD : 緯度・経度 |
ファイル形式 | S : Shape形式 M : GML形式 |
測地系 | J : 日本測地系 W : 世界測地系 |
ダウンロード後は必ず希望するファイルがダウンロードできているか確認すること。
(ダウンロードできていない・異なる座標系のファイルをダウンロードしていたことがあったが、やり直すと正常にダウンロードできていた)
次はShapeファイルからGeoJSONに変換する。