空气污染

我们生存的环境是越来越糟糕,很多不为人知的专业名词如
PM2.5三聚氰胺 等都能让我们耳熟能详,估计再过几年我们这些老百姓都能变成化学方面的专家。

作为「数据采集爱好者」针对近十年国内空气质量的变化趋势非常感兴趣,刚好我们的 中华人民共和国环境保护部信息中心 提供了这样的数据,所以将他们站点的数据抓取了下来并整理成 SQLite 数据库,方便给大家用作数据分析使用。

宁波历年空气质量曲线展示

例如,我简单做了个表用于展示宁波地区 2001 - 2013 的空气质量曲线

如果您要问我这些数据可靠吗?我只能告诉你这是从 中华人民共和国环境保护部信息中心 官方抓取获得的数据,至于数据本身的真实性全凭您个人主观判断吧。目前采集脚本还继续在工作,所以不定期我还是会打包分享最新的数据包(但频率不会那么高)。

有关数据库表库字段方面的说明可以参考项目的说明文档,这个项目所有的抓取脚本、说明文档都是开源的,并放到了 github 上

大家如果有其他更好的数据源,可以很方便的扩展这个脚本。欢迎大家能够提供更靠谱的数据源,将这个数据库中的数据完善起来。

如果需要在线查询接口的,可以考虑使用 http://pm25.in/ 服务,个人觉得很靠谱。

最后,提供SQLite 数据库打包(bzip 格式)下载(请通过下方的页面下载最新数据库)。PS,题图出处在这里,其实图片没有看起来那么美…

--

2014年03月12日更新

最新的 Sqlite 数据文件以及说明可以到这里查看 http://www.gracecode.com/aqi.html

-- EOF --