• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于有序聚类的马尔科夫链对北京市空气质量的预测研究

蒋泽坤 陈炫轮
  
速读·中旬
2022年2期
河北地质大学经济学院 河北 石家庄 050031

打开文本图片集

◆摘  要:在全球对环境问题越发重视的大背景下,采用有序样本聚类将北京市2013年12月到2021年6月的91份空气质量指数(AQI)划分为七个等级,并采用集对分析构造集对权重配合马尔科夫链对未来的空气质量指数进行区间预测,比精准性的数值预测更具有可信度,可以为相关部门制定计划提供依据。

◆关键词:有序聚类;马尔科夫链;集对分析;空气质量指数(AQI)

一、文献综述

空气质量作为与人类健康息息相关的自然因素,对其进行研究具有十分重要的意义。目前对于空气质量的研究主要集中在两个主要方面:探究空气污染成因和污染物质浓度的准确性数值预测。

探究空气污染成因。Tofful Luca采集城郊地区独立住户室内外的PM2.5浓度,探讨了室内外污染源对生活环境中颗粒物化学组成的影响。

污染物质浓度的准确性数值预测。Chae Sangwon将插值应用于空气质量和天气数据,然后使用卷积神经网络(CNN)预测PM浓度。并据此提出了一个实时预测模型,可以预测空气中的颗粒物(PM)的浓度。

二、研究方法和数据来源

2.1有序样本聚类

有序样本聚类有别于常见的聚类分析方法,通常的聚类方法是依据样本特征的相似度或者距离,按照一定的分类标准将样本划分到若干个类别中。有序样本聚类独有的特点是在样品顺序不被打乱的前提下进行分类,适用于对不能打乱顺序的客观现象进行聚类分析。

2.2集对分析

集对是联系数学中的一个基本概念,指两个有一定关联的集合做组成的一个新的系统。

2.3马尔科夫链

马尔科夫链的基本特性就是无后效性,其直观解释就是现象未来得状态只依赖于现在,而与过去的状态无关。自然界中的现象总是呈现为随机过程,而马尔科夫链就被广泛的运用到随机过程的建模当中,如天气预报、运筹决策、安全科学、统计物理及计算机科学等领域中。

2.4数据来源

本文所使用的数据均来自于杭州真气科技公司的真气网,真气网是一个空气质量情况监测平台,具体数据为北京市2013年12月份到2021年6月份的月度空气质量指数(AQI)。

三、实证分析

3.1 有序样本聚类的实现

本文进将北京市2013年12月到2021年6月这91个月的空气质量指数按从大到小的顺序进行排列,借助R软件绘出了有序聚类的损失函数L[b(n,k)]与分类数k的关系图像,可知当把这91份空气质量指数按从小到大顺序排列分为6类时,其损失函数值最小。分类结果如表1所示。

3.2 马尔科夫性检验

无后效性是马尔科夫链最基本的特性,同样也是随机过程进行马尔科夫建模的前提条件,只有满足无后效性这一特性,才能使用马尔科夫链的相关理论。根据计算卡方统计量[χ][2]=45.794,当给定显著性水平[α]=0.05时,查找卡方分布表可得[χ][a2][](m-1)[2][]=[χ][0.05][2](25)=37.652<[χ2]=45.794所以北京市空气质量指数序列满足无后效性。

3.3 空气质量预测

对空气质量这种自然界中存在着很大的不确定性的随机过程,精准性的数值预测往往缺乏一定的可信度和说服力,如果根据状态空间划分现象,进而对预测期目标现象所处的状态空间进行预测,则往往更加可靠且对各种决策的制定具有很重要的参考价值。

对北京市这91个月份的空气质量指数,按照时间顺序以及不同的滞时步长统计其状态转移情况,即可得到相应滞时步长的状态转移频数矩阵和对应的状态频率转移矩阵。要预测2021年7月份的空气质量所处的状态区间,本文选取最大滞时为5的5个时点,即2021年2月到2021年6月这5个月份进行加权的马尔科夫链预测,表2即加权马尔科夫链的预测过程。

根据表2中集对加权的结果各个状态的概率值中的最大值对应状态4,根据表1可以得知2021年7月的空气质量指数的取值范围为113≤x<137。根据国家对空气质量指数的级别划分,此范围处于轻度污染状态。

四、结论

空气质量情况作为自然界的随机过程具有很强的随机性,所以目标现象的准确性数值预测相对于状态空间范围的预测往往缺乏一定的可信度,而状态空间范围的预测结果在提高可信度的同时也能为研究者和相关单位、人员的决策提供可靠理论依据。本文所采用的基于有序聚类的加权马尔科夫链,根据有序聚类的损失函数来判断,最为合理的分类数并以此作为加权马尔科夫链的状态空间划分标准,提高了状态划分的科学性。

参考文献

[1]伍艳清.2017~2020年高明区春节及元宵期间空气质量分析研究[J].广东化工,2021,48(12):146-147.

作者简介

蒋泽坤(1997-),男,安徽亳州人,硕士研究生,主要研究方向大数据分析。

*本文暂不支持打印功能

monitor