本数据库基于 中华人民共和国环境保护部信息中心 等公共数据来源抓取并汇总而成,提供给网友作为当地空气质量的历史数据参考。
目前数据库包含 3231
个地区的总计 444391
条数据,时间跨度为 2000-06-05
至 2015-02-25
。
注:后续数据抓取因资源方面以及政策等方面的限制,不再定期抓取,感谢理解。如果您需要后续更新的数据,您可以使用下方提供的源代码,自行抓取。
下载连接
文件校验码,请下载以后校验:
$ md5sum aqi.sqlite.gz
e1d932831d297ff834e1165b122e9e12 aqi.sqlite.gz
下载 CSV 格式的数据
$ md5sum *.csv
bd995603b29716c1291233cbf39694f2 aqi.csv
946d89e0cda256fa3564a442ddd3f7a3 areas.csv
推荐使用 SQLite 格式,索引已加。
常见问题
版权问题?
本项目抓取部分的代码使用 LGPL 协议 ,可以自由使用。
数据来源主要为 中华人民共和国环境保护部信息中心 ,因此以此机构制定的明文细则为准。本人个人不承担任何因此造成的直接、间接后果。
数据表结构说明在哪里?
在项目中已经说明了,参见 https://github.com/feelinglucky/AQI。
时间戳格式如何转换为可读时间?
使用 sqlite 的 datetime
函数即可,例如
select datetime(recordDate, 'unixepoch', 'localtime') from aqi limit 1;
详情参见 https://sqlite.org/lang_datefunc.html 。
源代码
本项目是开源项目,您可以自由下载和查看源代码,并用于自定义规则的抓取。
项目地址为 https://github.com/feelinglucky/AQI,建议在运行此项目前请仔细阅读 README
文件。
点杯咖啡给我?
写脚本抓数据其实是件「费力不讨好」的事情,需要花费更多看不见的精力和时间。虽然个人产出的的这些代码可能毫无用处甚至脏乱不堪,但还是「恬不知耻」的希望的到您的帮助和鼓励。
我的支付宝帐号是 amdk6@yeah.net
,不要求数额只要求心意到了即可。这些费将计划用于维持服务器、博主吃喝等实际的开支。
最后,祝愿各位学业、工作顺利!
-- EOF --