Meteostat
Meteostat 是最大的开源的天气和气候数据供应商之一。
数据获取方式
Meteostat 提供了三种方式来获取数据:
- JSON API: 他使用了 Restful 格式的 API 来与数据源进行交互,能够很方便的用于网页端。不过他是收费的(免费每天只有 500 个请求额度)
- Python Library: Python 库,他不需要密钥,是免费使用的
- Bulk Data: 批量大数据集,他以全球的气象站为节点来下载所有气象站的历史数据,这也是我们获取全部数据集的主要方式
他们之间的是相互联系的,其中 Bulk Data
是其他两个的基础,而 Python Library
完全依赖于 Bulk Data
会根据传入的坐标来自动匹配最近的气象站点来返回结果。而 JSON API
中会按照精度来匹配 Bulk Data
中的数据的同时如果精度误差过大会使用内置的大模型算法来拟合数据。
Tips
Meteostat 的数据完全依赖于官方维护的气象站的数据,因此返回的数据可能与当地气象局或者体感数据有出入。
Bulk Data
要批量下载数据集有两个步骤:
- 通过
https://bulk.meteostat.net/v2/stations/full.json.gz
下载所有的气象站的数据 - 之后就可以通过
https://bulk.meteostat.net/v2/{hourly|daily|monthly}/{station_id}.csv.gz
来下载每小时、每日、每月的对应气象站的数据集
Tips
其中气象站是由用户上传并由 Meteostat 维护的。