上篇对 POI 数据的介绍 中提到,高德的 API 接口返回的并非是完整的 POI 数据,而是存在一定的缺失。
因此为了补漏,距上次抓取两个月后,再次对全国的 POI 数据进行了全范围抓取。统计后发现,补漏与更新的效果还是比较明显的。
数量上,从上次的 4500w+ 扩充到了 5600w+,这个数量已经超过了网络上有人所称的5000w 。并且,对超过 1000w 的数据进行了内容更新,更新包括名称的更改、位置的微调、分类的调整、地址的修改等。
名称更改与位置微调
各省份 与 TOP 30 城市的 POI 数量
| 省份 | 数量 | 城市 | 数量 | |
|---|---|---|---|---|
| 广东省 | 620万+ | 上海市 | 180万+ | |
| 江苏省 | 475万+ | 北京市 | 150万+ | |
| 浙江省 | 385万+ | 广州市 | 120万+ | |
| 山东省 | 380万+ | 成都市 | 115万+ | |
| 四川省 | 305万+ | 深圳市 | 110万+ | |
| 河南省 | 300万+ | 重庆市 | 105万+ | |
| 河北省 | 235万+ | 苏州市 | 100万+ | |
| 湖北省 | 210万+ | 杭州市 | 85万+ | |
| 湖南省 | 205万+ | 东莞市 | 75万+ | |
| 安徽省 | 190万+ | 武汉市 | 70万+ | |
| 辽宁省 | 180万+ | 天津市 | 70万+ | |
| 上海市 | 180万+ | 佛山市 | 60万+ | |
| 福建省 | 170万+ | 西安市 | 60万+ | |
| 广西壮族自治区 | 155万+ | 宁波市 | 60万+ | |
| 北京市 | 150万+ | 南京市 | 55万+ | |
| 陕西省 | 150万+ | 郑州市 | 55万+ | |
| 江西省 | 140万+ | 无锡市 | 55万+ | |
| 云南省 | 140万+ | 青岛市 | 55万+ | |
| 山西省 | 120万+ | 长沙市 | 50万+ | |
| 黑龙江省 | 115万+ | 温州市 | 45万+ | |
| 重庆市 | 105万+ | 沈阳市 | 45万+ | |
| 内蒙古自治区 | 100万+ | 石家庄市 | 45万+ | |
| 贵州省 | 95万+ | 金华市 | 40万+ | |
| 吉林省 | 95万+ | 昆明市 | 40万+ | |
| 甘肃省 | 75万+ | 哈尔滨市 | 40万+ | |
| 天津市 | 70万+ | 合肥市 | 40万+ | |
| 新疆维吾尔自治区 | 70万+ | 常州市 | 35万+ | |
| 宁夏回族自治区 | 30万+ | 南宁市 | 35万+ | |
| 海南省 | 30万+ | 济南市 | 35万+ | |
| 香港特别行政区 | 25万+ | 泉州市 | 35万+ | |
| 青海省 | 20万+ | |||
| 西藏自治区 | 20万+ | |||
| 澳门特别行政区 | 5万以下 | |||
| 台湾省 | 5万以下 |
数据字段信息
数据字段信息