市区町村データを扱う際に注意すべきこと4選
GISや地図系のデータを扱う人なら、よくみる「市区町村コード」や「市区町村名」。
みなさん、この市区町村コードは行政区域の統廃合によって年々変わっているのはご存知ですか?
同じ市区町村コードでも年によって行政区域名が異なっていたり、ある年には存在していた市区町村コードが最新年には存在しなかったりします。
今回は、市区町村データを扱うときに注意すべき点を4つ紹介します。
目次
市区町村データについて
まず初めに市区町村データについてですが、よく見かけるのが、「市区町村コード」や「市区町名」だと思います。
市区町村コードは、その名の通り行政区域を一意に識別するコードで都道府県や市区町村単位で定められています。
正式には都道府県コードと市区町村コードを合わせて「全国地方公共団体コード」と呼ばれ、総務省が管理しています。
天気や道路網、位置情報に代表される空間地理情報データにはよくこの市区町村コードが付属データとして付与されていることが多いです。
例えば、国土数値情報が提供している行政区域データでは全国地方公共団体コードや都道府県名、市区町村名、さらに行政区域のポリゴンが含まれています。
市区町村コードの仕様
続いては市区町村コードの仕様について紹介します。
コードの基本構造
各桁の意味は以下のようになっています。
- 第1〜2桁(都道府県コード):各都道府県を識別する01〜47の番号
- 第3〜5桁(市区町村コード):各市区町村や一部事務組合等を識別する番号
- 第6桁(検査数字):入力ミス等を防ぐための検証用の数字
データによっては検査数字は省略されていることがあります。
コードの割り当てルール(3桁目~5桁目)
種別によって、使用される番号の範囲が決まっています。
- 000:都道府県自体を指します(例:東京都は 13000)。
- 100:政令指定都市を指します
- 101〜199:特別区(東京23区)および政令指定都市の「区」
- 201〜299:市(政令指定都市を除く)
- 301〜799:町村
上記の他に細かいルールがあるので、気になる方は総務省の公式サイトで確認してみてください。
名称変更や合併時のルール
意外と重要なので、覚えておきましょう。
-
名称変更のみ:
- コードは変更されず、元のコードが引き継がれます
-
町村が市になった場合:
- 新しい「市」の番号が新設され、元の町村コードは欠番となります
-
合併(廃置分合):
- 既存の名称を継承する場合:その名称のコードを引き継ぎます
- 新しい名称にする場合:新しい番号を採番し、元のコードはすべて欠番となります
余談ですが、1999年(平成11年)~ 2010年(平成22年)に実施された大規模な市区町村合併は「平成の大合併」と呼ばれています。
市区町村データを扱う際の注意点
市区町村コードの仕様を踏まえて、市区町村データを扱う際にいくつか気をつけるべき点があります。
1. 同じ市区町村コードでも年によって市区町村名が異なる
同じ市区町村コードでも年によって市区町村名が変わっている場合があります。
これは、市区町村の名称変更によって発生します。
2019年の兵庫県篠山市の名称変更が例として挙げられます。
| 2019/05/01以前 | 2019/05/01以降 | |
|---|---|---|
| 市区町村コード | 28221 | 28221 |
| 市区町村名称 | 篠山市 | 丹波篠山市 |
2. 過去に存在していた市区町村コードが最新年には存在しない
この場合は、市区町村の統廃合によって起こります。
廃置分合前の市区町村コードが欠番となったことにより発生します。
例としては2024年の静岡県浜松市における行政区再編があります。
| 2024年以前 | 2024年以降 | 補足欄 | |
|---|---|---|---|
| 浜松市中区 | 22131 | 欠番 | 中央区に再編 |
| 浜松市東区 | 22132 | 欠番 | 中央区に再編 |
| 浜松市西区 | 22133 | 欠番 | 中央区に再編 |
| 浜松市南区 | 22134 | 欠番 | 中央区に再編 |
| 浜松市北区(三方原地区) | 22135 | 欠番 | 中央区に再編 |
| 浜松市北区(三方原地区以外) | 22135 | 欠番 | 浜名区に再編 |
| 浜松市浜北区 | 22136 | 欠番 | 浜名区に再編 |
| 浜松市天竜区 | 22137 | 22140 | 新設 |
| 浜松市中央区 | - | 22138 | 新設 |
| 浜松市浜名区 | - | 22139 | 新設 |
再編前に使われていたいくつかの市区町村コードは現在は欠番になっており、現在は使われていません。
3. 市区町村コードの仕様に必ずしも従うわけではない
市区町村コードの仕様がありますが、必ずその仕様に従っているわけでもないので注意が必要です。
どういうこと?と思いますよね。
先ほどの静岡県浜松市の行政区再編の例を見ていただくのが一番理解しやすかと思います。
再編前後において、天竜区は区域や名称が変化していません。
そのため、本来であれば、天竜区の市区町村コードは再編前のコードである「22137」が引き継がれるはずです。
ですが、実際は新しいコード「22140」に変更されています。
なぜなんでしょうね??(理由は分かりません笑)
市区町村コードの仕様は頭に入れつつも、実際は行政の公式サイトなどで確認した方が安全です。
4. 似たような行政域名称が存在する
市区町村ではありませんが、町字単位では似たような行政区域名があるので紹介します。
一見するとデータの不備と錯覚してしまいそうですよね。。
愛知県大府市共和町
- 共和町(キョウワチョウ、〒474-0061)
- 共和町(キョウワマチ、〒474-0057)
新潟県北区東栄町
- 東栄町(トウエイチョウ、〒950-3323)
- 東栄町(ヒガシサカエマチ、〒950-3104)
兵庫県明石市和坂
- 兵庫県明石市和坂(カニガサカ、〒673-0012)
- 兵庫県明石市和坂(ワサカ、〒673-0012)
町字名称だけを見ると重複しているので、データを扱う際(特にSQLでのUNIQUEやDISTINCTのような操作)は気をつけた方が良さそうです。
最後に
市区町村データでよく見る市区町村コードの仕様と扱う際の注意すべき点を紹介しました。
市区町村データはマスターデータとしても利用されることが多いので、扱い方には注意したいですよね。
現在、市区町村の合併や名称変更は頻繁に行われることは少ないですが、市区町村に関するデータを整備する際に役に立ってくれれば嬉しいです。